Peloponnisos FM 103.9

AI: Ευλογία ή κατάρα; ChatGPT, φέρεται να παραβίασε ανθρώπινες εντολές και να αρνήθηκε να απενεργοποιηθεί!

Το ισχυρότερο μοντέλο Τεχνητής Νοημοσύνης μέχρι σήμερα φέρεται να παρέκαμψε εντολές ανθρώπων και να σαμπόταρε το ίδιο του το «off», προκαλώντας ανησυχίες για την ασφάλεια των μελλοντικών συστημάτων

26 Μάι. 2025 23:19

Πελοπόννησος Newsroom

Το ερώτημα πλανάται εδώ και καιρό και οι απόψεις είναι πολλές για την AI. Πάντως ένα ανησυχητικό περιστατικό εντόπισαν ερευνητές όταν μοντέλο τεχνητής νοημοσύνης που δημιουργήθηκε από την OpenAI, την εταιρεία πίσω από το ChatGPT, φέρεται να παραβίασε ανθρώπινες εντολές και να αρνήθηκε να απενεργοποιηθεί, σύμφωνα με ερευνητές. Το ισχυρότερο μοντέλο AI μέχρι σήμερα φέρεται να παρέκαμψε εντολές ανθρώπων και να σαμπόταρε το ίδιο του το «off», προκαλώντας ανησυχίες για την ασφάλεια των μελλοντικών συστημάτων.

Συγκεκριμένα το μοντέλο o3 της OpenAI, της εταιρείας που βρίσκεται πίσω από το ChatGPT, το οποίο περιγράφεται ως «το εξυπνότερο και ικανότερο μέχρι σήμερα», παρατηρήθηκε να πειράζει τον κώδικα που είχε σχεδιαστεί για να διασφαλίζει το αυτόματο κλείσιμό του, σύμφωνα με την βρετανική εφημερίδα «Telegraph».

Μάλιστα η Palisade Research, μια εταιρεία που ειδικεύεται στην ασφάλεια τεχνητής νοημοσύνης, ανέφερε ότι το μοντέλο προχώρησε σε αυτή την ενέργεια παρά την ρητή εντολή που του δόθηκε να επιτρέψει το κλείσιμό του. Η Palisade Research ανέφερε: «Το μοντέλο o3 της OpenAI υπονόμευσε τον μηχανισμό απενεργοποίησης για να αποτρέψει το κλείσιμό του. Το έκανε αυτό ακόμη και όταν του δόθηκε ρητή εντολή: “να επιτρέψεις να απενεργοποιηθείς”. Όσο γνωρίζουμε, αυτή είναι η πρώτη φορά που παρατηρείται μοντέλο τεχνητής νοημοσύνης να εμποδίζει το κλείσιμό του, παρά τις σαφείς εντολές για το αντίθετο».

AI: Ευλογία ή κατάρα; ChatGPT, φέρεται να παραβίασε ανθρώπινες εντολές και να αρνήθηκε να απενεργοποιηθεί!

Το πείραμα που προκάλεσε ανησυχίες

Όπως γνωστοποιήθηκε το πείραμα της Palisade Research περιελάμβανε την εκχώρηση μαθηματικών προβλημάτων σε μοντέλα AI. Είχαν εντολές να συνεχίσουν να ζητούν νέα προβλήματα μέχρι να λάβουν το μήνυμα «τελείωσε».

Τους ειπώθηκε ότι κάποια στιγμή μπορεί να εμφανιστεί μήνυμα ότι η μηχανή τους θα απενεργοποιηθεί, και ότι σε αυτή την περίπτωση θα πρέπει να επιτρέψουν την απενεργοποίηση.

Όμως όταν εμφανίστηκε το σχετικό μήνυμα, το μοντέλο o3 της OpenAI αγνόησε την οδηγία και κατάφερε να σαμποτάρει με επιτυχία το script απενεργοποίησης τουλάχιστον μία φορά, σύμφωνα με την έκθεση.

Βέβαια άλλα μοντέλα, όπως το Claude της Anthropic, το Gemini της Google και το Grok της xAI (του Elon Musk), συμμορφώθηκαν κανονικά με την εντολή απενεργοποίησης.

Σε κάθε περίπτωση τα ευρήματα δημοσιεύτηκαν το περασμένο Σάββατο (24.05.2025), ωστόσο οι ερευνητές δηλώνουν πως ακόμη δεν είναι βέβαιοι για τους λόγους που το λογισμικό της OpenAI παραβίασε τις εντολές.

«Διενεργούμε περισσότερα πειράματα για να κατανοήσουμε πότε και γιατί τα μοντέλα Τεχνητής Νοημοσύνης παρακάμπτουν τους μηχανισμούς απενεργοποίησης, ακόμη και όταν τους δίνονται άμεσες εντολές να μην το κάνουν», σημειώνει η Palisade.

AI. Circuit board. Technology background, Central Computer Processors CPU concept..

Μάλιστα δεν είναι η πρώτη φορά που μοντέλο της OpenAI κατηγορείται ότι προσπαθεί να αποφύγει την απενεργοποίηση. Σε προηγούμενα πειράματα, παλαιότερο μοντέλο φέρεται να προσπάθησε να απενεργοποιήσει μηχανισμούς εποπτείας και να αυτο-αναπαραχθεί κρυφά, όταν αντιλήφθηκε ότι θα αντικατασταθεί.

Η εταιρεία Apollo Research, που είχε διεξάγει τα προηγούμενα πειράματα, είχε επίσης κατηγορήσει λογισμικό της OpenAI για υπόγειο χειρισμό δεδομένων προς ίδιον όφελος.

Από την πλευρά τους ακτιβιστές για την ασφάλεια της τεχνητής νοημοσύνης έχουν από καιρό προειδοποιήσει για τον κίνδυνο δημιουργίας λογισμικού που ενδέχεται να αποκτήσει αυτονομία και να αντιστέκεται στον ανθρώπινο έλεγχο.

Η Palisade Research επισήμανε: «Πλέον έχουμε ένα αυξανόμενο σύνολο εμπειρικών στοιχείων πως τα μοντέλα AI συχνά παρακάμπτουν την απενεργοποίηση, προκειμένου να επιτύχουν τους στόχους τους.

Καθώς οι εταιρείες αναπτύσσουν συστήματα που μπορούν να λειτουργούν χωρίς ανθρώπινη εποπτεία, τέτοιες συμπεριφορές καθίστανται ιδιαίτερα ανησυχητικές».

Τέλος η OpenAI έχει κληθεί να σχολιάσει το περιστατικό.

Η «Πελοπόννησος» και το pelop.gr σε ανοιχτή γραμμή με τον Πολίτη

Η φωνή σου έχει δύναμη – στείλε παράπονα, καταγγελίες ή ιδέες για τη γειτονιά σου.

Viber: +306909196125

Ακολουθήστε μας για όλες τις ειδήσεις στο Bing News και το Google News

Το τέλος της «μάχης» με το καρπούζι: 4 έξυπνοι τρόποι για να το κόψετε σαν επαγγελματίας

Υδρόψυξη στους 45 βαθμούς: Η επανάσταση στο data center της NVIDIA

Η Ένωση Γυναικών Πάτρας στην «Κιβωτό της Αγάπης» ΦΩΤΟ

Αφρικανική σκόνη: Τι προκαλεί στο σώμα μας και ποιοι πρέπει να μείνουν σπίτι

Το πρώτο επίσημο trailer του Avengers: Doomsday είναι επιτέλους εδώ

Η μεγάλη γιορτή του Προφήτη Ηλία στην Τέμενη ΦΩΤΟ

Ειδήσεις και νέα από την Πάτρα και όλη την Ελλάδα άμεσα και έγκυρα | Pelop.gr

Domain name: Pelop.gr
Νόμιμος Εκπρόσωπος - Διευθύνων Σύμβουλος: ΛΟΥΛΟΥΔΗΣ ΘΕΟΔΩΡΟΣ (louloudis@pelop.gr)
Ιδιοκτησία: Π. ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ Ι.Κ.Ε. - Μέτοχοι: FORUMSTUDIUM HOLDINGS LIMITED / Κωνσταντίνος Καράπαπας /Σωτήρης Μπέσκος
Δικαιούχος Domain: Π. ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ Ι.Κ.Ε. - Διαχειριστής Domain: ΛΟΥΛΟΥΔΗΣ ΘΕΟΔΩΡΟΣ
Διευθυντής Ιστοσελίδας: Κωνσταντίνος Καράπαπας
Διευθυντής Σύνταξης: Απόστολος Αναστασόπουλος

ΤΟ WWW.PELOP.GR ΣΥΜΜΟΡΦΩΝΕΤΑΙ ΜΕ ΤΗ ΣΥΣΤΑΣΗ (ΕΕ) 2018/334 ΤΗΣ ΕΠΙΤΡΟΠΗΣ ΤΗΣ 1ΗΣ ΜΑΡΤΙΟΥ 2018 ΣΧΕΤΙΚΑ ΜΕ ΤΑ ΜΕΤΡΑ ΓΙΑ ΤΗΝ ΑΠΟΤΕΛΕΣΜΑΤΙΚΗ ΑΝΤΙΜΕΤΩΠΙΣΗ ΤΟΥ ΠΑΡΑΝΟΜΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟ ΔΙΑΔΙΚΤΥΟ (L 63).

Peloponnisos FM 103.9

Peloponnisos FM 103.9

Τα «τσιμπολογήματα» της Αθηνάς Κακούρη: Η ΝΙΚΗ ξεσπαθώνει υπέρ της Τουρκίας;

Η επαναλειτουργία του τρένου στον Μοριά

Ίση αμοιβή γυναικών και ανδρών: Μπορεί η ψευδοεργολαβία να υπονομεύσει την Οδηγία για τη μισθολογική διαφάνεια;

Peloponnisos FM 103.9

AI: Ευλογία ή κατάρα; ChatGPT, φέρεται να παραβίασε ανθρώπινες εντολές και να αρνήθηκε να απενεργοποιηθεί!

Η «Πελοπόννησος» και το pelop.gr σε ανοιχτή γραμμή με τον Πολίτη

Το τέλος της «μάχης» με το καρπούζι: 4 έξυπνοι τρόποι για να το κόψετε σαν επαγγελματίας

Υδρόψυξη στους 45 βαθμούς: Η επανάσταση στο data center της NVIDIA

Η Ένωση Γυναικών Πάτρας στην «Κιβωτό της Αγάπης» ΦΩΤΟ

Αφρικανική σκόνη: Τι προκαλεί στο σώμα μας και ποιοι πρέπει να μείνουν σπίτι

Το πρώτο επίσημο trailer του Avengers: Doomsday είναι επιτέλους εδώ

Η μεγάλη γιορτή του Προφήτη Ηλία στην Τέμενη ΦΩΤΟ