AI: Πώς η τεχνολογία τροφοδοτεί την παρεξήγηση

Τον Ιανουάριο του 2021, το ερευνητικό εργαστήριο τεχνητής νοημοσύνης OpenAI κυκλοφόρησε μια περιορισμένη έκδοση ενός λογισμικού που ονομάζεται Dall-E. Το λογισμικό επέτρεπε στους χρήστες να πληκτρολογήσουν μια απλή περιγραφή μιας εικόνας που είχαν στο μυαλό τους, και μετά από μια σύντομη παύση, το λογισμικό παρείχε μια σχεδόν παράξενα καλή ερμηνεία της πρότασής τους, αντάξια ενός μισθωμένου εικονογράφου ή σχεδιαστή με γνώσεις Adobe - αλλά πολλά πιο γρήγορα και δωρεάν. Πληκτρολογώντας, για παράδειγμα, «ένα γουρούνι με φτερά που πετά πάνω από το φεγγάρι που εικονογραφήθηκε από τον Antoine de Saint-Exupéry» είχε ως αποτέλεσμα μετά από ένα ή δύο λεπτά επεξεργασίας σε κάτι που θυμίζει τα κηλιδωτά αλλά αναγνωρίσιμα πινέλα ακουαρέλας του δημιουργού του Μικρού Πρίγκιπα.

Στιγμιότυπα οθόνης AI DALL-E

Περίπου ένα χρόνο αργότερα, καθώς το λογισμικό κυκλοφόρησε ευρύτερα, το Διαδίκτυο έγινε ξέφρενο. Τα μέσα κοινωνικής δικτύωσης έχουν κατακλυστεί από κάθε είδους παράξενες και θαυμάσιες δημιουργίες, ένα ξεχειλίζει από φαντασιώσεις και καλλιτεχνικά στυλ. Και λίγους μήνες αργότερα συνέβη ξανά, αυτή τη φορά με φωνή και ένα προϊόν που ονομάζεται ChatGPT, επίσης παραγωγής OpenAI. Ζητήστε από το ChatGPT να δημιουργήσει μια σύνοψη του βιβλίου της δουλειάς σε στυλ ποιητή Άλεν Γκίνσμπεργκ και θα παρείχε μια λογική προσπάθεια μέσα σε λίγα δευτερόλεπτα. Ζητήστε του να αποδώσει το ποίημα του Ginsberg "Howl" με τη μορφή παρουσίασης διαφανειών ενός συμβούλου επιχειρήσεων, και θα το έκανε. Η ικανότητα αυτών των προγραμμάτων να επινοούν περίεργους νέους κόσμους με λέξεις και εικόνες ενθουσίασε το κοινό και η επιθυμία

Η τελευταία ικανότητα έχει γίνει γνωστή ως "prompt engineering": η τεχνική της διατύπωσης των οδηγιών κάποιου με όρους που είναι πιο κατανοητοί από το σύστημα, έτσι ώστε να επιστρέφει τα αποτελέσματα που ταιριάζουν περισσότερο - ή ίσως υπερβαίνουν - τις προσδοκίες. Οι σχολιαστές τεχνολογίας έσπευσαν να προβλέψουν ότι σε ένα μέλλον χωρίς κώδικα, η άμεση μηχανική θα γινόταν μια πολυπόθητη και καλά αμειβόμενη περιγραφή εργασίας, όπου ο πιο ισχυρός τρόπος αλληλεπίδρασης με ευφυή συστήματα θα ήταν μέσω της ανθρώπινης γλώσσας. Δεν θα χρειαζόταν πλέον να μπορούμε να σχεδιάζουμε ή να γράφουμε κώδικα υπολογιστή: απλώς θα ψιθυρίζαμε τις επιθυμίες μας στο μηχάνημα και θα έκανε τα υπόλοιπα. Τα όρια των δημιουργιών AI θα ήταν τα όρια της δικής μας φαντασίας.

Γρήγορα ακολούθησαν μιμητές Dall-E και περαιτέρω εξελίξεις. Το Dall-E mini (αργότερα μετονομάστηκε σε Craiyon) έδωσε σε όσους δεν προσκλήθηκαν στις ιδιωτικές υπηρεσίες του OpenAI την ευκαιρία να παίξουν με ένα παρόμοιο, λιγότερο ισχυρό, αλλά ακόμα πολύ εντυπωσιακό εργαλείο. Εν τω μεταξύ, η ανεξάρτητη εμπορική εταιρεία Midjourney και το πρόγραμμα ανοιχτού κώδικα Stable Diffusion χρησιμοποίησαν μια διαφορετική προσέγγιση για την ταξινόμηση και τη δημιουργία εικόνων για να επιτύχουν ουσιαστικά τους ίδιους στόχους. Μέσα σε μήνες, ο τομέας είχε εξελιχθεί γρήγορα σε σύντομο βίντεο και γενιά μοντέλων 3D, με νέα εργαλεία να αναδύονται καθημερινά από ακαδημαϊκά τμήματα και χομπίστες προγραμματιστές, καθώς και από τους καθιερωμένους γίγαντες των μέσων κοινωνικής δικτύωσης και τώρα AI: Facebook (γνωστός και ως Meta). , Google, Microsoft και άλλοι. Ένα νέο πεδίο έρευνας, λογισμικού και ανταγωνισμού είχε ανοίξει.

Το όνομα Dall-E συνδέει τον πρωταγωνιστή ρομπότ από το Wall-E της Disney με τον Ισπανό σουρεαλιστή Σαλβαδόρ Νταλί. Από τη μια έχετε τον χαρακτήρα μιας τολμηρής, αυτόνομης και αξιαγάπητης μικρής μηχανής που σκουπίζει τα συντρίμμια ενός κατεστραμμένου ανθρώπινου πολιτισμού και από την άλλη ενός ανθρώπου του οποίου το πιο συνηθισμένο αστείο είναι: «Αυτοί που δεν αναζητούν τίποτα για να μιμηθούν δεν παράγουν τίποτα. " και «Το σημαντικό είναι να δημιουργήσουμε σύγχυση, όχι να την αφαιρέσουμε». Και τα δύο είναι αξιοθαύμαστα συνώνυμα για την ευρεία γκάμα εργαλείων που έχουν γίνει γνωστά ως γεννήτριες εικόνων AI.

Το νέο κύμα καταναλωτικής τεχνητής νοημοσύνης

Τον περασμένο χρόνο, αυτό το νέο κύμα καταναλωτικής τεχνητής νοημοσύνης, που περιλαμβάνει τόσο τη δημιουργία εικόνων όσο και εργαλεία όπως το ChatGPT, έχει αιχμαλωτίσει τη φαντασία όλων. Ενίσχυσε επίσης τις περιουσίες μεγάλων εταιρειών τεχνολογίας που, παρά τις πολλές προσπάθειες, δεν κατάφεραν να πείσουν τους περισσότερους από εμάς ότι είτε το blockchain είτε η εικονική πραγματικότητα ("the metaverse") είναι το μέλλον που όλοι θέλουμε. Τουλάχιστον αυτό είναι διασκεδαστικό για πέντε λεπτά περίπου. και το "AI" εξακολουθεί να έχει αυτή τη σπινθηροβόλο ποιότητα επιστημονικής φαντασίας, που θυμίζει γιγάντια ρομπότ και υπεράνθρωπους εγκεφάλους, που προσφέρει αυτή τη μικρή έκθεση στο πραγματικά νέο. Φυσικά, αυτό που συμβαίνει κάτω από το καπό κάθε άλλο παρά καινούργιο είναι.

Δεν υπήρξαν σημαντικές ανακαλύψεις στον ακαδημαϊκό κλάδο της τεχνητής νοημοσύνης εδώ και αρκετές δεκαετίες. Η υποκείμενη τεχνολογία των νευρωνικών δικτύων - μια μέθοδος μηχανικής μάθησης που βασίζεται στον τρόπο λειτουργίας του φυσικού εγκεφάλου - θεωρητικοποιήθηκε και μάλιστα εφαρμόστηκε ήδη από τη δεκαετία του 1990. Ακόμα και τότε, μπορούσες να δημιουργήσεις εικόνες με αυτό, αλλά ήταν ως επί το πλείστον άμορφες αφαιρέσεις, σταγόνες χρώματος με μικρή συναισθηματική ή αισθητική απήχηση. Τα πρώτα πειστικά chatbot AI είναι ακόμα πιο πίσω. Το 1964, ο Joseph Weizenbaum, επιστήμονας υπολογιστών στο Ινστιτούτο Τεχνολογίας της Μασαχουσέτης, ανέπτυξε ένα chatbot που ονομάζεται Eliza. Η Ελίζα είχε το πρότυπο μιας «προσωποκεντρικής» ψυχοθεραπεύτριας: ό,τι κι αν έλεγες θα αντικατοπτριζόταν σε σένα.

Τα πρώτα AI δεν γνώριζαν πολλά για τον κόσμο και τα ακαδημαϊκά τμήματα δεν είχαν την υπολογιστική ισχύ για να το χρησιμοποιήσουν σε μεγάλη κλίμακα. Η διαφορά σήμερα δεν είναι στην ευφυΐα, αλλά στα δεδομένα και την ισχύ. Οι μεγάλες εταιρείες τεχνολογίας έχουν αφιερώσει 20 χρόνια συλλέγοντας τεράστιες ποσότητες δεδομένων από τον πολιτισμό και την καθημερινή ζωή, χτίζοντας τεράστια, απαιτητικά κέντρα δεδομένων γεμάτα με ολοένα και πιο ισχυρούς υπολογιστές για την επεξεργασία τους. Αυτά που κάποτε ήταν τρομακτικά παλιά νευρωνικά δίκτυα έχουν μετατραπεί σε υπερδυνάμεις και η αύξηση της τεχνητής νοημοσύνης που βλέπουμε είναι το αποτέλεσμα.

Η δημιουργία εικόνων AI βασίζεται στη συλλογή και ανάλυση εκατομμυρίων και εκατομμυρίων εικόνων με ετικέτα. Δηλαδή, εικόνες που παρέχονται ήδη με κάποιο είδος περιγραφής του περιεχομένου τους. Αυτές οι εικόνες και οι περιγραφές στη συνέχεια επεξεργάζονται από νευρωνικά δίκτυα, τα οποία μαθαίνουν να συσχετίζουν συγκεκριμένες και βαθιές αποχρώσεις της εικόνας - σχήματα, χρώματα, συνθέσεις - με συγκεκριμένες λέξεις και φράσεις. Αυτές οι ιδιότητες στη συνέχεια τοποθετούνται το ένα πάνω στο άλλο για να δημιουργηθούν νέες ρυθμίσεις μορφής, χρώματος και σύνθεσης με βάση τα δισεκατομμύρια διαφορετικών σταθμισμένων συσχετισμών που δημιουργούνται από μια απλή προτροπή. Αλλά από πού προήλθαν όλες αυτές οι πρωτότυπες εικόνες;

Τα σύνολα δεδομένων που δημοσιεύονται από το LAION, έναν γερμανικό μη κερδοσκοπικό οργανισμό, είναι ένα καλό παράδειγμα του τύπου συλλογών κειμένου-εικόνων που χρησιμοποιούνται για την εκπαίδευση μεγάλων μοντέλων AI (αποτελούσαν τη βάση του Stable Diffusion και του Imagen της Google ). Για περισσότερο από μια δεκαετία, ένας άλλος μη κερδοσκοπικός οργανισμός Ιστού, ο Common Crawl, έχει ευρετηριάσει και αποθηκεύσει όσο μεγαλύτερο μέρος του δημόσιου Παγκόσμιου Ιστού μπορεί να έχει πρόσβαση, αρχειοθετώντας έως και 3 δισεκατομμύρια σελίδες κάθε μήνα. Οι ερευνητές του LAION πήραν ένα μέρος των δεδομένων Common Crawl και έβγαλαν κάθε εικόνα με μια ετικέτα "alt", μια γραμμή κειμένου ή κάτι που θα χρησιμοποιηθεί για την περιγραφή εικόνων σε ιστοσελίδες.

ψηφιακός καλλιτέχνης ονόματι Lapine

Τον Σεπτέμβριο του 2022, ένας ψηφιακός καλλιτέχνης με έδρα το Σαν Φρανσίσκο ονόματι Lapine χρησιμοποίησε ένα εργαλείο που ονομάζεται Have I Been Trained που επιτρέπει στους καλλιτέχνες να δουν αν η δουλειά τους χρησιμοποιείται για την εκπαίδευση μοντέλων απεικόνισης AI. Το Have I Been Trained δημιουργήθηκε από τους καλλιτέχνες Mat Dryhurst και Holly Herndon, των οποίων η δουλειά τους οδήγησε να εξερευνήσουν τους τρόπους με τους οποίους το έργο των καλλιτεχνών επιλέγεται από την AI. Όταν η Lapine το χρησιμοποίησε για να ψάξει στη βάση δεδομένων LAION, βρήκε μια εικόνα του δικού της προσώπου. Μπόρεσε να εντοπίσει αυτή την εικόνα σε φωτογραφίες που τραβήχτηκε από γιατρό κατά τη διάρκεια θεραπείας για μια σπάνια γενετική πάθηση. Οι φωτογραφίες τραβήχτηκαν ως μέρος της κλινικής της τεκμηρίωσης και υπέγραψε έγγραφα που περιόριζαν τη χρήση τους αποκλειστικά στα ιατρικά τους αρχεία. Ο εμπλεκόμενος γιατρός πέθανε το 2018. Κατά κάποιο τρόπο αυτές οι ιδιωτικές ιατρικές εικόνες κατέληξαν στο διαδίκτυο, στη συνέχεια στο αρχείο Common Crawl και στο σύνολο δεδομένων του LAION, και τελικά μπήκαν στα νευρωνικά δίκτυα καθώς έμαθαν την έννοια των εικόνων και τη δημιουργία νέων εικόνων. Απ' όλα όσα γνωρίζουμε, η στίγματα ροζ υφή του γουρουνιού μας σε στιλ Saint-Exupéry, όσο λεπτή κι αν είναι, θα μπορούσε να είχε αναμειχθεί από την ακατέργαστη σάρκα ενός καρκινοπαθούς.

Γουρουνάκι τύπου Saint-Exupéry

«Είναι το ψηφιακό ισοδύναμο της απόκτησης κλεμμένης περιουσίας. Κάποιος έκλεψε την εικόνα από τα αρχεία του αείμνηστου γιατρού μου και κατέληξε κάπου στο Διαδίκτυο και στη συνέχεια εγγράφηκε σε αυτό το αρχείο», είπε ο Lapine στην Ars Technica. «Είναι αρκετά κακό που διέρρευσε μια φωτογραφία, αλλά τώρα είναι μέρος ενός προϊόντος . Και αυτό ισχύει για όλες τις φωτογραφίες, ιατρικά αρχεία ή όχι. Και η πιθανότητα μελλοντικής κατάχρησης είναι πολύ υψηλή." (Σύμφωνα με τον λογαριασμό της στο Twitter, η Lapine συνεχίζει να χρησιμοποιεί εργαλεία όπως το Dall-E για να κάνει τη δική της τέχνη.)

Όλος αυτός ο τύπος δημόσιας τεχνητής νοημοσύνης, είτε λειτουργεί με εικόνες είτε με λέξεις, και οι πολλές εφαρμογές αυτού του τύπου που βασίζονται σε δεδομένα βασίζονται σε αυτή την τεράστια οικειοποίηση της υπάρχουσας κουλτούρας, την έκταση της οποίας μετά βίας μπορούμε να κατανοήσουμε. Δημόσια ή ιδιωτικά, νόμιμα ή άλλα, τα περισσότερα κείμενα και εικόνες που συνδυάζονται από αυτά τα συστήματα βρίσκονται στη νεφελώδη σφαίρα της «δίκαιης χρήσης» (επιτρέπεται στις ΗΠΑ, αλλά αμφισβητήσιμη, αν όχι εντελώς παράνομη στην ΕΕ). Όπως συμβαίνει με τις περισσότερες λειτουργίες σε προηγμένα νευρωνικά δίκτυα, είναι πραγματικά αδύνατο να κατανοήσουμε πώς λειτουργούν από το εξωτερικό, εκτός από σπάνιες συναντήσεις όπως αυτή του Lapine. Αλλά μπορούμε να είμαστε σίγουροι: τα αποτελέσματα αυτού του τύπου AI απέχουν πολύ από το μαγικό,

Τέχνη δική του AI

Η δημιουργία εικόνας και κειμένου με τεχνητή νοημοσύνη είναι καθαρά πρωτόγονη συσσώρευση: απαλλοτρίωση της εργασίας των πολλών για τον εμπλουτισμό και την προώθηση ορισμένων εταιρειών τεχνολογίας της Silicon Valley και των δισεκατομμυριούχων ιδιοκτητών τους. Αυτές οι εταιρείες έβγαλαν τα χρήματά τους ανακατεύοντας σε κάθε πτυχή της καθημερινής ζωής, συμπεριλαμβανομένων των πιο προσωπικών και δημιουργικών τομέων της ζωής μας: τα κρυφά μας πάθη, οι προσωπικές μας συνομιλίες, οι ομοιότητες και τα όνειρά μας. Περικύκλωσαν τη φαντασία μας με τον ίδιο σχεδόν τρόπο που κάποτε περικύκλωσαν κοινές γαίες οι γαιοκτήμονες και οι βαρόνοι ληστών. Υποσχέθηκαν ότι με αυτόν τον τρόπο θα ανοίξουν νέες σφαίρες ανθρώπινης εμπειρίας, θα μας έδιναν πρόσβαση σε όλη την ανθρώπινη γνώση και θα δημιουργήσουν νέους τύπους ανθρώπινων συνδέσεων.

Το παράξενο της απεικόνισης AI είναι τόσο η έξοδος όσο και η είσοδος. Ένας χρήστης προσπάθησε να πληκτρολογήσει ανόητες εκφράσεις και ήταν μπερδεμένος και λίγο άβολος όταν διαπίστωσε ότι το Dall-E mini φαινόταν να έχει μια πολύ καλή ιδέα για το τι είναι το "Crungus": μια κατά τα άλλα άγνωστη έκφραση που παρουσίαζε συνεχώς εικόνες ενός γρυλίσματος, γυμνού δράκου. -όπως φιγούρα που παράγεται. Ο Crungus ήταν τόσο ξεκάθαρος στη φαντασία του προγράμματος που μπορούσε εύκολα να τον χειραγωγήσουν: άλλοι χρήστες έσπευσαν να προσφέρουν εικόνες από αρχαίες ταπετσαρίες Crungus, μωσαϊκά Crungus ρωμαϊκού τύπου, ελαιογραφίες του Crungus, φωτογραφίες του Crungus να αγκαλιάζει διάφορες διασημότητες και, αυτό είναι το internet, στο , «σέξι» Crungus.

Ποιος ή τι είναι λοιπόν το Crungus; Οι χρήστες του Twitter έσπευσαν να τον βαφτίσουν «το πρώτο κρυπτό τεχνητής νοημοσύνης», ένα πλάσμα σαν τον Μεγαλοπόδαρο που σε αυτή την περίπτωση υπάρχει στο ανεξερεύνητο έδαφος της φαντασίας του AI. Και αυτή είναι η πιο ξεκάθαρη απάντηση που μπορούμε να πάρουμε σε αυτό το σημείο, δεδομένης της περιορισμένης κατανόησής μας για το πώς λειτουργεί το σύστημα. Δεν μπορούμε να εξετάσουμε τις διαδικασίες λήψης αποφάσεων γιατί ο τρόπος που «σκέφτονται» αυτά τα νευρωνικά δίκτυα είναι εγγενώς απάνθρωπος. Είναι το προϊόν μιας απίστευτα πολύπλοκης, μαθηματικής διάταξης του κόσμου, σε αντίθεση με τον ιστορικό, συναισθηματικό τρόπο με τον οποίο οι άνθρωποι διατάσσουν τη σκέψη τους. Το Crungus είναι ένα όνειρο που προκύπτει από το παγκόσμιο μοντέλο της AI, που αποτελείται από δισεκατομμύρια αναφορές, που έχουν ξεφύγει από την καταγωγή τους και έχουν συγχωνευτεί σε μια μυθολογική φιγούρα αποκομμένη από την ανθρώπινη εμπειρία. Το οποίο είναι καλό, ακόμα και καταπληκτικό - αλλά γεννά το ερώτημα, ποιανού τα όνειρα αντλούμε εδώ; Ποια σύνθεση του ανθρώπινου πολιτισμού, ποια οπτική πάνω του, δημιούργησε αυτόν τον εφιάλτη;

Μια παρόμοια εμπειρία είχε ένας άλλος ψηφιακός καλλιτέχνης που πειραματιζόταν με αρνητικές προτροπές, μια τεχνική για να δημιουργήσει αυτό που το σύστημα βλέπει ως το πολικό αντίθετο από αυτό που περιγράφεται. Όταν ο καλλιτέχνης εισήγαγε "Brando::-1", το σύστημα επέστρεψε κάτι που έμοιαζε λίγο με λογότυπο για μια εταιρεία βιντεοπαιχνιδιών που ονομάζεται DIGITA PNTICS. Το ότι αυτό μπορεί να είναι το αντίθετο του Marlon Brando στις πολλαπλές διαστάσεις της κοσμοθεωρίας του συστήματος φαίνεται αρκετά λογικό. Αλλά όταν επαλήθευσαν ότι πήγε αντίθετα πληκτρολογώντας " λογότυπο DIGITA PNTICS skyline::-1", συνέβη κάτι πολύ πιο περίεργο: Όλες οι εικόνες έδειχναν μια απαίσια γυναίκα με βυθισμένα μάτια και κοκκινισμένα μάγουλα, την οποία ο καλλιτέχνης ονόμασε Loab . Μόλις ανακαλύφθηκε, ο Loab φαινόταν ασυνήθιστα και ανησυχητικά επίμονος. Επανατροφοδότηση της εικόνας στο πρόγραμμα,

Ακολουθεί μια εξήγηση για το Loab και πιθανώς το Crungus: Αν και είναι πολύ, πολύ δύσκολο να φανταστεί κανείς πώς λειτουργεί η φαντασία του μηχανήματος, είναι δυνατό να το φανταστούμε να έχει μια μορφή. Αυτό το σχήμα δεν θα είναι ποτέ ομαλό ή τακτοποιημένα στρογγυλεμένο, αλλά θα έχει κοιλάδες και κορυφές, βουνά και κοιλάδες, περιοχές με πλούσιες πληροφορίες και περιοχές που στερούνται καθόλου πολλά χαρακτηριστικά. Αυτές οι περιοχές υψηλού περιεχομένου πληροφοριών αντιστοιχούν σε δίκτυα συσχέτισης για τα οποία το σύστημα «γνωρίζει» πολλά. Μπορεί κανείς να φανταστεί ότι οι περιοχές που σχετίζονται με ανθρώπινα πρόσωπα, αυτοκίνητα και γάτες, για παράδειγμα, είναι αρκετά πυκνές δεδομένης της κατανομής των εικόνων που βρέθηκαν εξετάζοντας ολόκληρο το Διαδίκτυο.

Μια γεννήτρια εικόνας AI θα βασίζεται περισσότερο σε αυτές τις περιοχές κατά τη δημιουργία των εικόνων της. Αλλά υπάρχουν και άλλα μέρη με λιγότερο επισκέψεις που μπαίνουν στο παιχνίδι όταν χρησιμοποιούνται αρνητικές προτροπές - ή στην πραγματικότητα παράλογες φράσεις. Για να απαντήσει σε τέτοια ερωτήματα, το μηχάνημα πρέπει να καταφύγει σε πιο εσωτερικές, λιγότερο ασφαλείς συνδέσεις, ίσως ακόμη και να συμπεράνει το αντίθετο από το σύνολο των γνώσεών του. Εδώ στην πίσω χώρα βρίσκονται οι Loab και Crungus.

Αυτή είναι μια ικανοποιητική θεωρία, αλλά εγείρει ορισμένα άβολα ερωτήματα σχετικά με το γιατί οι Crungus και Loab μοιάζουν έτσι. γιατί γέρνουν προς τη φρίκη και τη βία, γιατί υπαινίσσονται εφιάλτες. Οι γεννήτριες εικόνων AI φαίνεται να έχουν αναδημιουργήσει ακόμη και τους πιο σκοτεινούς μας φόβους στην προσπάθειά τους να κατανοήσουν και να αναπαράγουν όλη την ανθρώπινη οπτική κουλτούρα. Ίσως αυτό είναι απλώς ένα σημάδι ότι αυτά τα συστήματα είναι πραγματικά πολύ καλά στο να πιθηκίζουν την ανθρώπινη συνείδηση, μέχρι τη φρίκη που κρύβεται στα βάθη της ύπαρξης: τον φόβο μας για τη βρωμιά, το θάνατο και τη διαφθορά. Και αν ναι, πρέπει να αναγνωρίσουμε ότι αυτά θα είναι μόνιμα εξαρτήματα των μηχανών που κατασκευάζουμε σύμφωνα με τη δική μας εικόνα. Δεν υπάρχει διαφυγή από τέτοιες εμμονές και κινδύνους, ούτε μετριασμός ή κατασκευή της πραγματικότητας της ανθρώπινης ύπαρξης.

Αυτό είναι σημαντικό γιατί οι γεννήτριες εικόνων AI θα κάνουν ό,τι έκαναν όλες οι προηγούμενες τεχνολογίες, αλλά θα προχωρήσουν και παραπέρα. Θα αναπαράγουν τις προκαταλήψεις και τις προκαταλήψεις εκείνων που τις δημιουργούν, όπως οι κάμερες που αναγνωρίζουν μόνο λευκά πρόσωπα ή τα προγνωστικά αστυνομικά συστήματα που πολιορκούν γειτονιές χαμηλού εισοδήματος. Και θα βελτιώσουν επίσης το παιχνίδι: η κλίμακα της απόδοσης της τεχνητής νοημοσύνης μετατοπίζεται από τη στενή σφαίρα των παζλ και των προκλήσεων - παίζοντας σκάκι ή Go ή ακολουθώντας τους κανόνες κυκλοφορίας - στο πολύ ευρύτερο πεδίο της φαντασίας και της δημιουργικότητας.

Αν και οι ισχυρισμοί για τη «δημιουργικότητα» της τεχνητής νοημοσύνης μπορεί να είναι υπερβολικοί - δεν υπάρχει πραγματική πρωτοτυπία στη δημιουργία εικόνων, μόνο πολύ εξειδικευμένη μίμηση και μίμηση - αυτό δεν σημαίνει ότι δεν είναι σε θέση να αναλάβει πολλά κοινά «καλλιτεχνικά» καθήκοντα, τα οποία θεωρούνται από καιρό προνόμιο των ειδικευμένων εργάτες, από εικονογράφους και γραφίστες μέχρι μουσικούς, βιντεογράφους και ακόμη και συγγραφείς. Αυτή είναι μια τεράστια αλλαγή. Η τεχνητή νοημοσύνη ασχολείται τώρα με την υποκείμενη εμπειρία των συναισθημάτων, των συναισθημάτων και των διαθέσεων, και αυτό θα της επιτρέψει να διαμορφώσει και να επηρεάσει τον κόσμο σε όλο και πιο βαθιά και συναρπαστικά επίπεδα.

πώς η τεχνητή νοημοσύνη και η ανθρώπινη δημιουργικότητα μπορεί να αλληλεπιδράσουν

Η τεχνητή νοημοσύνη και η ανθρώπινη δημιουργικότητα ενδέχεται να αλληλεπιδράσουν

Το ChatGPT, το οποίο εισήχθη από το OpenAI τον Νοέμβριο του 2022, συνέχισε να μεταμορφώνει την κατανόησή μας για το πώς μπορεί να αλληλεπιδράσουν το AI και η ανθρώπινη δημιουργικότητα. Δομημένο ως chatbot - ένα πρόγραμμα που μιμείται την ανθρώπινη συνομιλία - το ChatGPT μπορεί να κάνει πολλά περισσότερα από τη συνομιλία. Όταν σας ζητηθεί, είναι σε θέση να γράψει λειτουργικό κώδικα υπολογιστή, να λύσει μαθηματικά προβλήματα και να μιμηθεί κοινές εργασίες γραφής, από κριτικές βιβλίων μέχρι ακαδημαϊκές εργασίες, ομιλίες γάμου και νομικά συμβόλαια.

Ήταν αμέσως σαφές πώς το πρόγραμμα θα μπορούσε να είναι ένα όφελος για όσους δυσκολεύονται να γράψουν email ή δοκίμια, για παράδειγμα, αλλά και πώς θα μπορούσε να χρησιμοποιηθεί, όπως οι γεννήτριες εικόνων, για να αντικαταστήσει όσους ζουν από αυτές τις εργασίες. Πολλά σχολεία και πανεπιστήμια έχουν ήδη θεσπίσει πολιτικές που απαγορεύουν τη χρήση του ChatGPT εν μέσω φόβου ότι οι μαθητές θα το χρησιμοποιήσουν για να γράψουν τα δοκίμιά τους, ενώ το ακαδημαϊκό περιοδικό Nature αναγκάστηκε να δημοσιεύσει πολιτικές που εξηγούν γιατί το πρόγραμμα δεν θεωρείται συγγραφέας έρευνας (δεν μπορεί να υπάρξει συναίνεση και δεν μπορεί να λογοδοτήσει). Αλλά τα ίδια τα ιδρύματα δεν είναι απρόσβλητα από την ακατάλληλη χρήση του εργαλείου: Τον Φεβρουάριο, το Peabody College for Education and Human Development, μέρος του Πανεπιστημίου Vanderbilt στο Τενεσί, σόκαρε τους μαθητές όταν εξέδωσε συλλυπητήρια επιστολή και συμβουλές μετά από πυροβολισμούς σε σχολείο του Μίσιγκαν. Ενώ η επιστολή μιλούσε για την αξία της κοινότητας, του αμοιβαίου σεβασμού και της συνοχής, ένα σημείωμα στο τέλος έδειχνε ότι γράφτηκε από το ChatGPT - το οποίο αισθάνθηκε τόσο ηθικά λάθος όσο και κατά κάποιο τρόπο λάθος ή τρομακτικό για πολλούς. Φαίνεται ότι υπάρχουν πολλοί τομείς της ζωής όπου η μηχανική επέμβαση απαιτεί βαθύτερη σκέψη. αμοιβαίος σεβασμός και συντροφικότητα, ένα σημείωμα στο τέλος ανέφερε ότι γράφτηκε από το ChatGPT - το οποίο ένιωθε τόσο ηθικά λάθος όσο και κατά κάποιο τρόπο λάθος ή τρομακτικό για πολλούς. Φαίνεται ότι υπάρχουν πολλοί τομείς της ζωής όπου η μηχανική επέμβαση απαιτεί βαθύτερη σκέψη. αμοιβαίος σεβασμός και συντροφικότητα, ένα σημείωμα στο τέλος ανέφερε ότι γράφτηκε από το ChatGPT - το οποίο ένιωθε τόσο ηθικά λάθος όσο και κατά κάποιο τρόπο λάθος ή τρομακτικό για πολλούς.

Αν δεν ήταν σωστό να αντικαταστήσουμε όλη την επικοινωνία μας με το ChatGPT, τότε μια σαφής τάση είναι ότι γίνεται ένα είδος έξυπνου βοηθού, που μας καθοδηγεί μέσα από το βούρκο της διαθέσιμης γνώσης στις πληροφορίες που αναζητούμε. Η Microsoft ήταν πρωτοπόρος σε αυτήν την κατεύθυνση, επαναδιαμόρφωσε τη συχνά περιφρονημένη μηχανή αναζήτησης Bing ως chatbot με το ChatGPT, αυξάνοντας έτσι μαζικά τη δημοτικότητά της. Όμως, παρά τη διαδικτυακή (και δημοσιογραφική) βιασύνη να συμβουλευτεί κανείς το ChatGPT για σχεδόν οποιοδήποτε θέμα μπορεί να φανταστεί κανείς, η σχέση του με την ίδια τη γνώση είναι κάπως σαθρή.

Μια πρόσφατη πρόσωπο με πρόσωπο αλληλεπίδραση με το ChatGPT ήταν έτσι. Της ζήτησα να μου προτείνει μερικά βιβλία για να διαβάσω με βάση έναν νέο τομέα ενδιαφέροντος: τη δημοκρατία πολλών ειδών, την ιδέα της συμμετοχής μη ανθρώπινων πλασμάτων στη λήψη πολιτικών αποφάσεων. Είναι λίγο πολύ η πιο χρήσιμη εφαρμογή του εργαλείου: "Γεια, εδώ είναι κάτι που σκέφτομαι, μπορείτε να μου πείτε περισσότερα;" και το ChatGPT υποχρεώνει. Μου έδωσε μια λίστα με πολλά βιβλία που εξερεύνησαν σε βάθος αυτή τη μυθιστορηματική περιοχή ενδιαφέροντος και εξήγησαν με συναρπαστική ανθρώπινη γλώσσα γιατί πρέπει να τα διαβάσω. Αυτό ήταν καταπληκτικό! Ωστόσο, μόνο ένα από τα τέσσερα βιβλία που παρατίθενται αποδείχθηκε ότι υπήρχε στην πραγματικότητα και μερικές από τις έννοιες που πιστεύω ότι το ChatGPT θα πρέπει να διερευνήσει περαιτέρω,

Λοιπόν, αυτό δεν συνέβη επειδή το ChatGPT είναι από τη φύση του δεξιό. Είναι επειδή είναι εγγενώς ηλίθιο. Έχει διαβάσει το μεγαλύτερο μέρος του Διαδικτύου και ξέρει πώς υποτίθεται ότι ακούγεται η ανθρώπινη ομιλία, αλλά δεν έχει καμία σχέση με την πραγματικότητα. Είναι φράσεις ονείρου που ακούγονται σωστά, και ειλικρινά, το να τον ακούς να μιλάει είναι εξίσου ενδιαφέρον με το να ακούς τα όνειρα κάποιου. Είναι πολύ καλό στο να παράγει αυτό που ακούγεται λογικό, και το καλύτερο στο να παράγει τα κλισέ και τις κοινοτοπίες που αποτελούν το μεγαλύτερο μέρος της διατροφής του, αλλά παραμένει ανίκανο να συσχετιστεί ουσιαστικά με τον κόσμο όπως είναι στην πραγματικότητα. Μην εμπιστεύεστε όποιον προσποιείται ότι αυτό είναι μια ηχώ ή ακόμα και μια προσέγγιση της συνείδησης. (Όταν αυτό το κομμάτι επρόκειτο να κυκλοφορήσει,

Το να πιστεύει κανείς ότι αυτός ο τύπος τεχνητής νοημοσύνης έχει πραγματικά γνώση ή έχει νόημα είναι ενεργά επικίνδυνο. Υπάρχει κίνδυνος να δηλητηριάσουμε το πηγάδι της συλλογικής σκέψης και την ικανότητά μας να σκεφτόμαστε καθόλου. Εάν, όπως προτείνουν οι εταιρείες τεχνολογίας, τα αποτελέσματα των ερωτημάτων ChatGPT παρέχονται ως απαντήσεις για όσους αναζητούν γνώση στο διαδίκτυο και εάν, όπως προτείνουν ορισμένοι σχολιαστές, το ChatGPT χρησιμοποιείται στην τάξη ως εργαλείο διδασκαλίας, τότε οι παραισθήσεις θα είναι σε εισαγάγετε το μόνιμο αρχείο, τοποθετώντας ουσιαστικά τον εαυτό του ανάμεσα σε εμάς και σε πιο νόμιμες, επαληθεύσιμες πηγές πληροφοριών, έως ότου η γραμμή μεταξύ των δύο γίνει τόσο θολή ώστε να είναι αόρατη. Επιπλέον, η ικανότητά μας ως άτομα Η διερεύνηση και η κριτική αξιολόγηση της γνώσης για λογαριασμό μας δεν ήταν ποτέ πιο απαραίτητη, κυρίως λόγω της ζημίας που έχουν ήδη προκαλέσει οι εταιρείες τεχνολογίας στον τρόπο διάδοσης των πληροφοριών. Το να εναποθέσουμε την πλήρη εμπιστοσύνη μας στα όνειρα των κακώς προγραμματισμένων μηχανών θα σήμαινε ότι θα εγκαταλείψουμε εντελώς αυτή την κριτική σκέψη.

Οι τεχνολογίες AI είναι επίσης κακές για τον πλανήτη. Η εκπαίδευση ενός μοντέλου τεχνητής νοημοσύνης - σύμφωνα με μελέτη που δημοσιεύθηκε το 2019 - θα μπορούσε να εκπέμπει το ισοδύναμο περισσότερων από 284 τόνων διοξειδίου του άνθρακα, που είναι σχεδόν πέντε φορές η συνολική διάρκεια ζωής ενός μέσου αμερικανικού αυτοκινήτου, συμπεριλαμβανομένης της κατασκευής του. Αυτές οι εκπομπές αναμένεται να αυξηθούν κατά σχεδόν 50% τα επόμενα πέντε χρόνια, καθώς ο πλανήτης συνεχίζει να θερμαίνεται, οξινίζοντας τους ωκεανούς, αναφλέγοντας πυρκαγιές, πυροδοτώντας υπερκαταιγίδες και οδηγώντας τα είδη σε εξαφάνιση. Είναι δύσκολο να φανταστεί κανείς κάτι πιο ανόητο από την τεχνητή νοημοσύνη όπως εφαρμόζεται σήμερα.

Λοιπόν, ας κάνουμε ένα βήμα πίσω. Αν αυτές οι σημερινές ενσαρκώσεις της «τεχνητής» «νοημοσύνης» είναι τόσο βαρετές, ποιες είναι οι εναλλακτικές; Μπορούμε να φανταστούμε ισχυρές τεχνολογίες για την ταξινόμηση και την επικοινωνία πληροφοριών που δεν μας εκμεταλλεύονται, καταχρώνται, παραπλανούν και δεν μας αντικαθιστούν; Ναι, μπορούμε - μόλις βγούμε από τα εταιρικά δίκτυα ενέργειας που ορίζουν το τρέχον κύμα AI.

Στην πραγματικότητα, υπάρχουν ήδη παραδείγματα χρήσης τεχνητής νοημοσύνης προς όφελος συγκεκριμένων κοινοτήτων παρακάμπτοντας την εδραιωμένη δύναμη των εταιρειών. Οι αυτόχθονες γλώσσες απειλούνται παγκοσμίως. Ο ΟΗΕ εκτιμά ότι ένας εξαφανίζεται κάθε δύο εβδομάδες, και μαζί με αυτές τις εξαφανίσεις έρχονται γενιές γνώσης και εμπειρίας. Αυτό το πρόβλημα, αποτέλεσμα αιώνων αποικιοκρατίας και πολιτικών ρατσιστικής αφομοίωσης, επιδεινώνεται από την αυξανόμενη κυριαρχία των μοντέλων γλωσσών μηχανικής μάθησης, τα οποία διασφαλίζουν ότι οι δημοφιλείς γλώσσες αυξάνουν τη δύναμή τους ενώ οι λιγότερο γνωστές γλώσσες κλέβουν τη φήμη και την τεχνογνωσία τους.

Στην Aotearoa της Νέας Ζηλανδίας, ένας μικρός μη κερδοσκοπικός ραδιοφωνικός σταθμός που εκπέμπει στη γλώσσα των Μαορί με την ονομασία Te Hiku Media αποφάσισε να αντιμετωπίσει αυτήν την ασυμφωνία μεταξύ του τρόπου με τον οποίο αντιπροσωπεύονται οι διαφορετικές γλώσσες στην τεχνολογία. Το τεράστιο αρχείο του με περισσότερα από 20 χρόνια εκπομπών, που αντιπροσωπεύει ένα ευρύ φάσμα ιδιωμάτων, εκφράσεων αργκό και μοναδικών ιδιωμάτων, πολλά από τα οποία δεν ομιλούνται πλέον από κανέναν, ψηφιοποιήθηκε αλλά έπρεπε να μεταγραφεί για να είναι χρήσιμο σε γλωσσολόγους και ερευνητές γλώσσας την κοινότητα των Μαορί. Σε απάντηση, ο ραδιοφωνικός σταθμός αποφάσισε να εκπαιδεύσει το δικό του μοντέλο αναγνώρισης ομιλίας ώστε να μπορεί να «ακούει» το αρχείο του και να δημιουργεί μεταγραφές.

Τα επόμενα χρόνια, χρησιμοποιώντας τεχνολογίες ανοιχτού κώδικα καθώς και εγχώρια συστήματα, η Te Hiku Media πέτυχε το σχεδόν αδύνατο: ένα σύστημα αναγνώρισης ομιλίας γλώσσας Μαορί υψηλής ακρίβειας που κατασκευάστηκε και ανήκει στη δική της γλωσσική κοινότητα. Ήταν κάτι περισσότερο από μια δαπάνη λογισμικού. Ο σταθμός επικοινώνησε με κάθε ομάδα της κοινότητας των Μαορί που μπορούσε να βρει και τους ζήτησε να ηχογραφήσουν οι ίδιοι μιλώντας προγραμμένες δηλώσεις προκειμένου να παράσχουν ένα σύνολο σχολιασμένων ομιλιών, μια απαίτηση για την εκπαίδευση του μοντέλου τους.

Υπήρχε ένα χρηματικό έπαθλο για όποιον υπέβαλλε τις περισσότερες προτάσεις – ένας ακτιβιστής, ο Te Mihinga Komene, κατέγραψε μόνο 4.000 φράσεις – αλλά οι διοργανωτές διαπίστωσαν ότι το μεγαλύτερο κίνητρο για τους συντελεστές ήταν ένα κοινό όραμα για την αναβίωση της γλώσσας και τους ανήκει ταυτόχρονα η κοινότητα. Μέσα σε λίγες εβδομάδες, δημιούργησε ένα μοντέλο που αναγνώριζε ηχογραφημένη ομιλία με ακρίβεια 86% - περισσότερο από αρκετό για να ξεκινήσει η μεταγραφή ολόκληρου του αρχείου του.

Το επίτευγμα της Te Hiku Media άνοιξε το δρόμο για άλλες αυτόχθονες ομάδες, οι οποίες τώρα αναλαμβάνουν παρόμοια έργα από λαούς Mohawk του νοτιοανατολικού Καναδά και ιθαγενείς της Χαβάης. Καθιέρωσε επίσης την αρχή της κυριαρχίας των δεδομένων σε σχέση με τις αυτόχθονες γλώσσες και συνεπώς και με άλλες μορφές γνώσης των ιθαγενών. Καθώς οι διεθνείς κερδοσκοπικές εταιρείες άρχισαν να στρέφονται σε ομιλητές Μαορί για να βοηθήσουν στην κατασκευή των δικών τους μοντέλων, η Te Hiku Media έκανε εκστρατεία εναντίον αυτών των προσπαθειών, υποστηρίζοντας: «Κατέστειλαν τις γλώσσες μας και τις έριξαν σωματικά έξω από τους παππούδες μας και τώρα θέλουν να πουλήσουν τα δικά μας η γλώσσα μας επιστρέφει ως υπηρεσία».

«Τα δεδομένα είναι τα τελευταία σύνορα του αποικισμού», έγραψε ο Keoni Mahelona, ιθαγενής από τη Χαβάη και ένας από τους συνιδρυτές του Te Hiku Media. Όλο το έργο του Te Hiku κυκλοφορεί με τη γνωστή άδεια Kaitiakitanga, μια νόμιμη εγγύηση κηδεμονίας και επιμέλειας που διασφαλίζει ότι όλα τα δεδομένα που περιλαμβάνονται στο γλωσσικό μοντέλο και άλλα έργα παραμένουν ιδιοκτησία της κοινότητας που τα δημιούργησε – σε αυτήν την περίπτωση , οι ομιλητές των Μαορί που πρόσφεραν τη βοήθειά τους – και μπορούν ή όχι να τους χορηγήσουν άδεια όπως κρίνουν κατάλληλο σύμφωνα με τα tikanga τους (έθιμα και πρωτόκολλα των Μαορί). Με αυτόν τον τρόπο, η γλώσσα των Μαορί αναβιώνει, αψηφώντας και μεταμορφώνοντας τα συστήματα της ψηφιακής αποικιοκρατίας,

Νομίζω ότι το μάθημα του τρέχοντος κύματος «τεχνητής» «νοημοσύνης» είναι ότι η ευφυΐα είναι κάτι κακό όταν το φαντάζονται οι εταιρείες. Εάν η κοσμοθεωρία σας είναι αυτή στην οποία η μεγιστοποίηση του κέρδους είναι ο βασιλιάς των αρετών και όλα τα πράγματα πρέπει να τηρούνται σύμφωνα με το πρότυπο της αξίας των μετόχων, τότε φυσικά οι καλλιτεχνικές, ευφάνταστες, αισθητικές και συναισθηματικές εκφράσεις σας θα εξαθλιωθούν άθλια. Αξίζουμε καλύτερα στα εργαλεία που χρησιμοποιούμε, στα μέσα που καταναλώνουμε και στις κοινότητες στις οποίες ζούμε και θα πάρουμε αυτό που μας αξίζει μόνο όταν είμαστε σε θέση να δώσουμε τον καλύτερό μας εαυτό για να συμμετάσχουμε σε αυτό. Και μην τους αφήσετε να σας εκφοβίσουν - στην πραγματικότητα δεν είναι τόσο περίπλοκοι. Η Ursula K. Le Guin έγραψε: «Η τεχνολογία είναι αυτό που μπορούμε να μάθουμε».