Could Artificial Intelligence Replace Photography?

Καθώς η τεχνολογία συνεχίζει να προοδεύει με γρήγορους ρυθμούς, έχει υπάρξει πολλή πρόσφατη συζήτηση σχετικά με το εάν οι ψηφιακές οθόνες μπορούν πραγματικά να αντικαταστήσουν τη φωτογραφία προϊόντων. Κάνοντας αυτό ένα βήμα παραπέρα, είναι δυνατόν μια μέρα η τεχνητή νοημοσύνη να δημιουργήσει εικόνες χωρίς να χρειάζεται καμία απολύτως συμβολή από φωτογράφο ή ψηφιακό καλλιτέχνη;

Ως φωτογράφοι, συχνά θαυμάζουμε πόσο δροσερή είναι η σύγχρονη τεχνολογία, πόσο γοητευτική είναι μια νέα “must-have” λειτουργία κάμερας ή πόσο έξυπνο είναι το λογισμικό επεξεργασίας εικόνας. Δεν θεωρώ τον εαυτό μου ιδιαίτερα ηλικιωμένο, αλλά όταν σκέφτομαι να χρησιμοποιήσω μια SLR χειροκίνητης εστίασης 35 mm (γιατί αυτό ήταν το μόνο που έπρεπε να χρησιμοποιήσουμε, όχι επειδή είμαι hipster) και συγκρίνω αυτήν την εμπειρία με την εκπληκτική ανίχνευση προσώπου ή ανίχνευσης ματιών αυτόματη εστίαση σε σύγχρονες κάμερες Χωρίς καθρέφτη, είναι δύσκολο να πιστέψω ότι αυτές οι τεράστιες τεχνολογικές εξελίξεις έχουν συμβεί στη ζωή μου. Ακόμα και το να κάθομαι στο σαλόνι μου, να ελέγχω τον φωτισμό και την οικιακή ψυχαγωγία με τη φωνή μου ή να καλώ βίντεο με έναν φίλο σε άλλη χώρα στο iPad μου είναι πράγματα που το παιδί μου θα θεωρούσε επιστημονική φαντασία. Ακόμη και το smartphone μου είναι αισθητά πιο ισχυρό από οποιονδήποτε υπολογιστή στον οποίο είχα πρόσβαση πριν ενηλικιωθώ. Στο μεγάλο σχέδιο της ανθρώπινης ιστορίας, ο χρόνος που χρειάζεται για να περάσει κανείς από την πρώτη εμπορικά διαθέσιμη κάμερα στο ευρύ κοινό σε smartphone με εξαιρετικά αποτελεσματικές ψηφιακές φωτογραφικές μηχανές στις τσέπες των περισσότερων ανθρώπων στον δυτικό κόσμο είναι εκπληκτικά μικρός.

DALL E mini

Αυτή την εβδομάδα είδα μερικές αστείες φωτογραφίες που δημοσιεύτηκαν στα μέσα κοινωνικής δικτύωσης από ένα έργο που ονομάζεται DALL E mini. Ήταν χοντροκομμένες φωτογραφίες πολύ τυχαίων πραγμάτων όπως ο Τζο Μπάιντεν να τρώει λουκάνικα ή οι αράχνες να φορούν σομπρέρο. Οι αστείες εικόνες στο Διαδίκτυο δεν είναι κάτι καινούργιο, αλλά υποτίθεται ότι παράγονται από τεχνητή νοημοσύνη. Μερικά από αυτά έμοιαζαν με απλά γραφικά ή κινούμενα σχέδια, ενώ άλλα έμοιαζαν σαν να είχαν βγει από βιντεοπαιχνίδι στις αρχές της δεκαετίας του 2000. Τίποτα δεν ήταν αυτό που θα θεωρούσα ρεαλιστικό. Οι περισσότερες από τις φωτογραφίες που κοινοποιήθηκαν στα μέσα κοινωνικής δικτύωσης ήταν αρκετά ανόητες, οπότε φυσικά, ήθελα να αναζητήσω την πηγή αυτών των φωτογραφιών. Μια σύντομη αναζήτηση στο Google με οδήγησε στο DALL · E mini. Το μοντέλο δημιουργίας Text-to-Image που βασίζεται σε Transformer σχεδιάστηκε από τους Boris Daima, Siraj Patel, Pedro Cuenca, Khalid Saifullah, Tanishk Abraham, Fuk Lee, Luke, Luke Melas και Ritubrata Ghosh.

Το DALL E mini είναι πολύ απλό. Γράφεις ένα SMS και μετά το AI, το οποίο έχει εκπαιδευτεί σε αφιλτράριστα δεδομένα από το διαδίκτυο, λειτουργεί και παράγει εννέα εικόνες με βάση το ερέθισμα κειμένου. Αυτές οι εικόνες είναι συνήθως πολύ διαφορετικές μεταξύ τους, αλλά είναι μια ερμηνεία τεχνητής νοημοσύνης των δεδομένων σας, με βάση δεδομένα στο Διαδίκτυο. Προς το παρόν, δεν είναι ιδιαίτερα γρήγορο, καθώς χρειάζονται δύο έως τέσσερα λεπτά για να δημιουργηθούν εικόνες αμφιβόλου ποιότητας στην καλύτερη περίπτωση. Αφού έπαιξα για πολύ περισσότερο από ό,τι πρέπει, μπορώ να δω ότι δεν είναι τίποτα άλλο από ένα χρυσωρυχείο meme αυτή τη στιγμή, αλλά ως ιδέα, είναι ωραίο, με συναρπαστικές μελλοντικές δυνατότητες.

Η φόρμα προορίζεται να χρησιμοποιηθεί για τη δημιουργία εικόνων που βασίζονται σε προτροπές κειμένου για έρευνα και προσωπική κατανάλωση. Οι προβλεπόμενες χρήσεις περιλαμβάνουν την υποστήριξη της δημιουργικότητας, τη δημιουργία χιουμοριστικού περιεχομένου και την παροχή περιέργειας σε γενιές σχετικά με τη συμπεριφορά ενός μοντέλου. Οι προβλεπόμενες χρήσεις εξαιρούν αυτές που περιγράφονται στην ενότητα κατάχρηση και χρήση εκτός πεδίου.

Αξίζει να σημειωθεί ότι αυτές οι εικόνες δημιουργούνται από την τεχνητή νοημοσύνη, η οποία έχει εκπαιδευτεί σε αφιλτράριστα δεδομένα που βρίσκονται στο Διαδίκτυο, για να παράγει τη δική της ερμηνεία των όρων αναζήτησης που παρέχουν οι χρήστες με τη μορφή μιας επιλογής βασικών εικόνων. Αξίζει επίσης να έχουμε κατά νου ότι οι άνθρωποι στο Διαδίκτυο χρησιμοποιούν τη δημιουργικότητα και τη φαντασία τους για να ζητήσουν από αυτό το AI να δημιουργήσει πράγματα με κωμικό αποτέλεσμα. Εάν σκοπεύετε να ρίξετε μια ματιά στον πίνακα συζητήσεων ή να δοκιμάσετε μόνοι σας τη δημιουργία εικόνων, να γνωρίζετε το κείμενο μεροληψίας και περιορισμών που παρέχονται από την ομάδα ανάπτυξης και να ξέρετε ότι μερικοί άνθρωποι στο Διαδίκτυο είναι ηλίθιοι που θα το βρουν αστείο όταν Η χρήση της τεχνητής νοημοσύνης παράγει αμφισβητήσιμες ή προσβλητικές εικόνες.

Αν και οι δυνατότητες των μοντέλων δημιουργίας εικόνων είναι εντυπωσιακές, μπορεί επίσης να ενισχύσουν ή να επιδεινώσουν τις κοινωνικές προκαταλήψεις. Αν και η έκταση και η φύση των προκαταλήψεων του μοντέλου DALL E mini δεν έχουν ακόμη τεκμηριωθεί πλήρως, λόγω του γεγονότος ότι το μοντέλο έχει εκπαιδευτεί σε αφιλτράριστα δεδομένα από το Διαδίκτυο, μπορεί να δημιουργήσει εικόνες που περιέχουν στερεότυπα εναντίον μειονοτικών ομάδων. Οι εργασίες για την ανάλυση της φύσης και της έκτασης αυτών των περιορισμών βρίσκονται σε εξέλιξη.

Το μέλλον των εικόνων που δημιουργούνται από την τεχνητή νοημοσύνη

Είναι πιθανώς ασφαλές να πούμε ότι κανένας φωτογράφος δεν θα χάσει τη δουλειά του λόγω τεχνητής νοημοσύνης σύντομα. Ωστόσο, αυτή η τεχνολογία εγείρει ορισμένα ερωτήματα σχετικά με το πώς μπορεί να είναι το μέλλον της φωτογραφίας. Τώρα ζούμε σε έναν κόσμο όπου οι φωτογραφίες που είναι αποθηκευμένες στο διαδίκτυο είναι διαθέσιμες σε λίγα δευτερόλεπτα σε όποιον χρειάζεται μια δημόσια φωτογραφία. Σίγουρα, οι φωτογραφίες τραβήχτηκαν από έναν δημιουργικό επαγγελματία που θα βγάλει κάποια έσοδα από αυτές, αλλά τι θα συμβεί όταν η μηχανική μάθηση φτάσει στο σημείο όπου μερικές γενικές φωτογραφίες μπορούν να δημιουργηθούν από την τεχνητή νοημοσύνη; Ποιος κατέχει τα δικαιώματα αυτών των εικόνων; Θα μπορούσε κάποτε αυτό να αντικαταστήσει μεγάλο μέρος της οικονομικής βιομηχανίας φωτογραφιών και να είναι επιζήμιο για τους φωτογράφους βιβλιοθηκών; Θα μπορούσαμε μια μέρα να δούμε την απόδοση προϊόντων ή τοποθεσιών που παράγονται εξ ολοκλήρου από έναν αυτοματοποιημένο αλγόριθμο που χρησιμοποιείται για εμπορικούς σκοπούς;

Εκτός από τα ανόητα μιμίδια και τις εικόνες, ήθελα να δω πόσο κοντά έφτασε αυτό το σύστημα στη δημιουργία ενός ζωντανού τοπίου, γι’ αυτό έδωσα στο DALL E mini μια απλή εισαγωγή κειμένου για να δω τι θα μπορούσε να κάνει από όμορφα τοπία ως εισαγωγή κειμένου. Εδώ είναι η εικόνα που έβγαλα σήμερα το πρωί. Προσέξτε, φωτογράφοι τοπίων! Τα μηχανήματα έρχονται για τις δουλειές σας!

Εκτιμώ ότι από την εμφάνιση των φωτογραφιών που παράγονται σήμερα φαίνεται υπερβολή να πιστεύουμε ότι θα μπορούσε να αντικαταστήσει έναν επαγγελματία φωτογράφο, αλλά πριν από 30 χρόνια το iPad και το FaceTime ήταν πράγματα επιστημονικής φαντασίας, ωστόσο όλοι τώρα κουβαλάμε μικρούς ισχυρούς υπολογιστές με Ψηφιακές φωτογραφικές μηχανές HD στις τσέπες μας κάθε μέρα. Οι προοπτικές για το μέλλον είναι συναρπαστικές ή τρομακτικές, ανάλογα με την άποψή σας.

Τα renders, που εξακολουθούν να γίνονται από ανθρώπους, αντικαθιστούν τη φωτογραφία προϊόντων σε ορισμένα μέρη. Είναι θέμα χρόνου να γίνουν τόσο ζωντανές οι ψηφιακές φωτογραφίες που δεν θα χρειαζόμαστε πραγματικούς φωτογράφους σε πολλές περιπτώσεις; Είναι δυνατόν να μην χρειάζεται η εμπορική φωτογράφιση όλη μέρα;

Ποια είναι η γνώμη σας για τα άβαταρ ή την τεχνητή νοημοσύνη που αντικαθιστούν τη φωτογραφία; Είναι αυτή η τεχνολογία συναρπαστική ή ανησυχητική; Σε ποιο βαθμό θα μπορούσε να είναι νόμιμη εμπορική χρήση αυτής της τεχνολογίας; Επιτρέψτε μου να μάθω στα σχόλια.

Leave a Comment