Η Meta ανοίγει για πρώτη φορά τα χαρτιά της για τα τσιπ A.I.
Η Meta έχει κατασκευάσει προσαρμοσμένα τσιπ υπολογιστών για να βοηθήσει στις εργασίες τεχνητής νοημοσύνης και επεξεργασίας βίντεο και μιλάει γι' αυτά για πρώτη φορά δημόσια.
H Meta, o γίγαντας της κοινωνικής δικτύωσης αποκάλυψε για πρώτη φορά τα σχέδιά της σχετικά με τα τσιπ πυριτίου σε δημοσιογράφους νωρίτερα αυτή την εβδομάδα, πριν από μια διαδικτυακή εκδήλωση την Πέμπτη, όπου θα συζητηθούν οι επενδύσεις της σε τεχνικές υποδομές τεχνητής νοημοσύνης.
Οι επενδυτές παρακολουθούν στενά τις επενδύσεις της Meta στην Τεχνητή Νοημοσύνη και το σχετικό υλικό του κέντρου δεδομένων, καθώς η εταιρεία ξεκινά μία σειρά αλλαγών στην οποία περιλαμβάνονται τουλάχιστον 21.000 απολύσεις και σημαντικές περικοπές κόστους.
Αν και είναι ακριβό για μια εταιρεία να σχεδιάζει και να κατασκευάζει τα δικά της τσιπ υπολογιστών, η αντιπρόεδρος υποδομών Alexis Bjorlin δήλωσε στο CNBC ότι η Meta πιστεύει ότι η βελτιωμένη απόδοση θα δικαιολογήσει την επένδυση. Η εταιρεία έχει επίσης αναθεωρήσει τα σχέδια των κέντρων δεδομένων της, ώστε να εστιάζει περισσότερο σε ενεργειακά αποδοτικές τεχνικές, όπως η υγρή ψύξη, για τη μείωση της υπερβολικής θερμότητας.
Ένα από τα νέα τσιπ υπολογιστών, το Meta Scalable Video Processor (MSVP), χρησιμοποιείται για την επεξεργασία και τη μετάδοση βίντεο στους χρήστες, μειώνοντας παράλληλα τις ενεργειακές απαιτήσεις. Η Bjorlin δήλωσε ότι «δεν υπήρχε τίποτα διαθέσιμο στο εμπόριο» που θα μπορούσε να χειριστεί το έργο της επεξεργασίας και της μετάδοσης 4 δισεκατομμυρίων βίντεο την ημέρα τόσο αποτελεσματικά όσο ήθελε η Meta.
Ο άλλος επεξεργαστής είναι ο πρώτος της οικογένειας τσιπ Meta Training and Inference Accelerator (MTIA) της εταιρείας που προορίζεται να βοηθήσει σε διάφορες ειδικές εργασίες τεχνητής νοημοσύνης. Το νέο τσιπ MTIA χειρίζεται συγκεκριμένα την «εξαγωγή συμπερασμάτων», δηλαδή όταν ένα ήδη εκπαιδευμένο μοντέλο AI κάνει μια πρόβλεψη ή αναλαμβάνει μια δράση.
Η Bjorlin δήλωσε ότι το νέο τσιπ AI βοηθά στην ανατροφοδότηση ορισμένων αλγορίθμων συστάσεων της Meta που χρησιμοποιούνται για την προβολή περιεχομένου και διαφημίσεων στις ροές ειδήσεων των χρηστών. Αρνήθηκε να απαντήσει ποιος κατασκευάζει το τσιπ, αλλά μια δημοσίευση στο ιστολόγιο ανέφερε ότι ο επεξεργαστής «κατασκευάζεται σε διαδικασία TSMC 7nm», υποδεικνύοντας ότι ο κολοσσός τσιπ Taiwan Semiconductor Manufacturing παράγει την τεχνολογία.
Είπε επίσης ότι η Meta έχει έναν «οδικό χάρτη πολλαπλών γενεών» για την οικογένεια τσιπ τεχνητής νοημοσύνης που περιλαμβάνει επεξεργαστές που χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, αλλά αρνήθηκε να δώσει λεπτομέρειες πέρα από το νέο τσιπ. Το Reuters ανέφερε προηγουμένως ότι η Meta ακύρωσε ένα αντίστοιχο έργο και ξεκίνησε ένα άλλο που υποτίθεται ότι θα κυκλοφορούσε γύρω στο 2025, αλλά η Bjorlin αρνήθηκε να σχολιάσει την εν λόγω αναφορά.
Επειδή η Meta δεν ασχολείται με την πώληση υπηρεσιών υπολογιστικού νέφους, όπως άλλες εταιρείες, συμπεριλαμβανομένης της μητρικής Alphabet της Google ή της Microsoft, η εταιρεία δεν θεωρεί ότι είναι υποχρεωμένη να μιλήσει δημοσίως για τα εσωτερικά της έργα τσιπ για κέντρα δεδομένων, πρόσθεσε.
«Αν δείτε ότι μοιραζόμαστε -τα δύο πρώτα τσιπ που αναπτύξαμε- σίγουρα δίνουμε μια μικρή εικόνα για το τι κάνουμε εσωτερικά», δήλωσε η Bjorlin. «Δεν χρειάστηκε να το διαφημίσουμε, αλλά ξέρετε, ο κόσμος ενδιαφέρεται».
Η αντιπρόεδρος μηχανικής της Meta, Aparna Ramani, δήλωσε ότι το νέο υλικό της εταιρείας αναπτύχθηκε για να λειτουργεί αποτελεσματικά με το δικό της λογισμικό PyTorch, το οποίο έχει γίνει ένα από τα πιο δημοφιλή εργαλεία που χρησιμοποιούνται από τρίτους προγραμματιστές για τη δημιουργία εφαρμογών τεχνητής νοημοσύνης.
Το νέο υλικό θα χρησιμοποιηθεί τελικά για να τροφοδοτήσει εργασίες που σχετίζονται με το metaverse, όπως η εικονική πραγματικότητα και η επαυξημένη πραγματικότητα, καθώς και το αναπτυσσόμενο πεδίο της δημιουργικής AI, το οποίο αναφέρεται γενικά σε λογισμικό AI που μπορεί να δημιουργεί, συναρπαστικό κείμενο, εικόνες και βίντεο.
Η Ramani δήλωσε επίσης ότι η Meta έχει αναπτύξει έναν βοηθό κωδικοποίησης με βάση τη δημιουργική AI για τους προγραμματιστές της εταιρείας, ώστε να τους βοηθήσει να δημιουργήσουν και να λειτουργήσουν ευκολότερα λογισμικό. Ο νέος βοηθός είναι παρόμοιος με το εργαλείο GitHub Copilot της Microsoft που κυκλοφόρησε το 2021 με τη βοήθεια της νεοφυούς επιχείρησης AI OpenAI.
Επιπλέον, η Meta δήλωσε ότι ολοκλήρωσε τη δεύτερη φάση κατασκευής ή την τελική κατασκευή του υπερυπολογιστή της με την ονομασία Research SuperCluster (RSC), την οποία η εταιρεία παρουσίασε λεπτομερώς πέρυσι. Η Meta χρησιμοποίησε τον υπερυπολογιστή, ο οποίος περιέχει 16.000 GPU A100 της Nvidia, για την εκπαίδευση του γλωσσικού μοντέλου LLaMA της εταιρείας, μεταξύ άλλων χρήσεων.
Η Ramani δήλωσε ότι η Meta συνεχίζει να ενεργεί σύμφωνα με την πεποίθησή της ότι πρέπει να συμβάλλει στις τεχνολογίες ανοικτού κώδικα και στην έρευνα τεχνητής νοημοσύνης, προκειμένου να προωθήσει τον τομέα της τεχνολογίας. Η εταιρεία αποκάλυψε ότι το μεγαλύτερο γλωσσικό μοντέλο LLaMA, LLaMA 65B, περιέχει 65 δισεκατομμύρια παραμέτρους και εκπαιδεύτηκε σε 1,4 τρισεκατομμύρια tokens, το οποίο αναφέρεται στα δεδομένα που χρησιμοποιούνται για την εκπαίδευση της AI.
Εταιρείες όπως η OpenAI και η Google δεν έχουν δημοσιοποιήσει παρόμοιες μετρήσεις για τα ανταγωνιστικά τους μεγάλα γλωσσικά μοντέλα, αν και το CNBC ανέφερε αυτή την εβδομάδα ότι το μοντέλο PaLM 2 της Google εκπαιδεύτηκε σε 3,6 τρισεκατομμύρια tokens και περιέχει 340 δισεκατομμύρια παραμέτρους.
Σε αντίθεση με άλλες εταιρείες τεχνολογίας, η Meta έδωσε το γλωσσικό μοντέλο LLaMA στους ερευνητές, ώστε να μπορούν να μάθουν από την τεχνολογία. Ωστόσο, το γλωσσικό μοντέλο LlaMA διέρρευσε στη συνέχεια στο ευρύτερο κοινό, με αποτέλεσμα πολλοί προγραμματιστές να δημιουργήσουν εφαρμογές που ενσωματώνουν την τεχνολογία.
Η Ramani, τέλος, δήλωσε ότι η Meta «εξακολουθεί να σκέφτεται όλες τις συνεργασίες μας με ανοιχτό κώδικα και, βεβαίως, θέλω να επαναλάβω ότι η φιλοσοφία μας εξακολουθεί να είναι η ανοιχτή έρευνα και η αμοιβαία συνεργασία».
moneyreview.gr
Ακολουθήστε το Money Review στο Google News