ΚΑΙΡΟΣ

ΗΠΑ: Δύο μοντέλα Τεχνητής Νοημοσύνης της Google αρίστευσαν στη Διεθνή Μαθηματική Ολυμπιάδα 2024

Τα μοντέλα AlphaProof και AlphaGeometry 2 έλυσαν τέσσερα από τα έξι προβλήματα που τους τέθηκαν στον φετινό διεθνή διαγωνισμό για μαθητές Λυκείου

Δύο μοντέλα της Τεχνητής Νοημοσύνης του Google DeepMind, του ερευνητικού εργαστηρίου του τεχνολογικού γίγαντα, κατάφεραν να λύσουν προβλήματα μαθηματικών στη Διεθνή Μαθηματική Ολυμπιάδα 2024, ενώ μέχρι στιγμής μοντέλα ΤΝ είχαν αποτύχει σε λογικούς συλλογισμούς.

Τα μοντέλα AlphaProof και AlphaGeometry 2 έλυσαν τέσσερα από τα έξι προβλήματα που τους τέθηκαν στον φετινό διεθνή διαγωνισμό για μαθητές Λυκείου, φτάνοντας στο επίπεδο ενός ασημένιου Ολυμπιονίκη, μια «πρωτιά» σύμφωνα με την Google.

Αναλυτικά, το AlphaProof έλυσε δύο προβλήματα άλγεβρας και ένα πρόβλημα αριθμητικής, ενώ το AlphaGeometry 2 ένα πρόβλημα γεωμετρίας.

Η 65η διοργάνωση της Διεθνούς Μαθηματικής Ολυμπιάδας πραγματοποιήθηκε στο Ηνωμένο Βασίλειο από τις 11 έως τις 22 Ιουλίου.

Αυτός ο διαγωνισμός, που διεξάγεται από το 1959, συγκεντρώνει μαθητές Λυκείου (και μερικές φορές ορισμένους εξαιρετικούς μαθητές) που επιλέγονται από περίπου 100 χώρες.

Η πρώτη έκδοση του AlphaGeometry είχε ήδη καταφέρει να λύσει 25 προβλήματα γεωμετρίας της Ολυμπιάδας από ένα σύνολο 30 επιλεγμένων ασκήσεων, έγραψε το επιστημονικό περιοδικό Nature τον Ιανουάριο.

«Αυτά τα αποτελέσματα ανοίγουν νέες προοπτικές στον τομέα των μαθηματικών συλλογισμών και δείχνει ένα μέλλον όπου μαθηματικοί και Τεχνητή Νοημοσύνη θα συνεργάζονται για την επίλυση σύνθετων προβλημάτων», ανέφερε η Google σε δελτίο Τύπου.

Τα μεγάλα γλωσσικά μοντέλα, κορυφαία προϊόντα της ΤΝ, έχουν μεγάλη δυσκολία σε τεστ λογικής, σύμφωνα με μελέτη που δημοσιεύθηκε τον Ιούνιο στο περιοδικό Open Science της Βρετανικής Βασιλικής Εταιρείας.

Αυτή διαπίστωσε ότι το ChatGPT 3.5 και 4 της OpenAI, το Bard της Google, το Claude 2 της Anthropic και τρεις εκδόσεις του Llama της Meta απάντησαν αντιφατικά και βασίστηκαν συχνά σε παράλογους συλλογισμούς.

Πηγή: ΑΠΕ-ΜΠΕ