Offcanvas
Offcanvas

Tech

Τεχνητή νοημοσύνη: Η καλά κρυμμένη «συνταγή» – Πώς οι εταιρείες παράγουν φθηνές λύσεις

Τεχνητή νοημοσύνη: Η καλά κρυμμένη «συνταγή» – Πώς οι εταιρείες παράγουν φθηνές λύσεις

Πόσο κοστίζει να ξεκινήσεις μια εταιρεία στην τεχνητή νοημοσύνη; - Η απάντηση κάθε μέρα όλο και λιγότερο

Στο κυνήγι της μείωσης του κόστους επιδίδονται οι εταιρείες τεχνητής νοημοσύνης, αντιγράφοντας πρακτικά τις εργασίες η μία της άλλης για να φτιάξουν όλο και πιο φθηνά γλωσσικά μοντέλα. Άλλωστε, όπως γράφει το business insider, τελικά στην ερώτηση πόσο κοστίζει να ξεκινήσει κάποιος μια εταιρεία AI η απάντηση είναι όλο και λιγότερα, καθώς τα μεγάλα γλωσσικά μοντέλα δημιουργούνται για όλο και μικρότερα ποσά.

Η απόσταξη στην τεχνητή νοημοσύνη

Η τεχνική αυτή, έχει ενθουσιάσει τους πιο μικρούς παίχτες λόγω του ότι μπορεί να δημιουργεί γλωσσικά μοντέλα μειώνοντας το κόστος υπολογιστικής ισχύος. Δεν ισχύει βέβαια ο ίδιος ενθουσιασμός και  για τις μεγάλες πολυεθνικές που έχουν επενδύσει δισεκατομμύρια τεράστια foundation models. Η απόσταξη θεωρείται μια παλιά έννοια που κερδίζει νέα σημασία.

Είναι ένα εργαλείο που χρησιμοποιούν οι προγραμματιστές, μαζί με τη βελτίωση (fine-tuning), για να βελτιώσουν τα μοντέλα κατά τη φάση εκπαίδευσης, αλλά με πολύ μικρότερο κόστος από άλλες μεθόδους. Οι δύο αυτές  τεχνικές χρησιμοποιούνται για να δώσουν στα μοντέλα ειδικές γνώσεις ή ικανότητες. Για τους περισσότερους, είναι καλή είδηση ενώ για άλλους  είναι περίπλοκη.  Σε κάθε περίπτωση για το μέλλον της τεχνητής νοημοσύνης, είναι σημαντική.

Ο ορισμός της απόσταξης

Οι προγραμματιστές και οι ειδικοί της τεχνητής νοημοσύνης ορίζουν την  απόσταξη ως μια διαδικασία στην οποία γίνεται χρήση ενός μοντέλου για να βελτιώσει ένα άλλο. Ένα μεγαλύτερο μοντέλο στο ρόλο του «δασκάλου»,  προτρέπει το σύστημα να παράγει απαντήσεις και μονοπάτια λογικής ενώ και ένα μικρότερο “μαθητευόμενο” μοντέλο μιμείται τη συμπεριφορά του.

Η κινεζική εταιρεία DeepSeek προκάλεσε αίσθηση με τα μοντέλα που θεωρείται ότι εκπαιδεύτηκαν με κόστος περίπου 5 εκατ. δολάρια. Αυτό έστειλε τις χρηματοπιστωτικές αγορές σε πανικό, τιμωρώντας την Nvidia με μια απώλεια 600 δισ.  δολαρίων σε κεφαλαιοποίηση της αγοράς λόγω της πιθανής μείωσης της ζήτησης για τσιπ (αν και αυτή η πτώση δεν έχει υλοποιηθεί ακόμα).

Η ομάδα ερευνητών του Πανεπιστημίου της Καλιφόρνιας, στο Μπέρκλεϊ, εκπαίδευσε δύο νέα μοντέλα με λιγότερο από 1.000 δολάρια σε υπολογιστικό κόστος, όπως ανέφερε η έρευνα τον Ιανουάριο.

Στις αρχές Φεβρουαρίου, ερευνητές από το Πανεπιστήμιο Στάνφορντ, το Πανεπιστήμιο της Ουάσιγκτον και το Allen Institute for AI κατάφεραν να εκπαιδεύσουν ένα μοντέλο λογικής για ένα μικρό κλάσμα αυτού του κόστους, σύμφωνα με έρευνα.

Η απόσταξη  κλειδί για όλες αυτές τις εξελίξεις

Ας πάρουμε για παράδειγμα  ένα γενικό μοντέλο βάσης όπως το Llama της Meta  και τη χρήση ενός άλλου μοντέλου ώστε να το αποστάξει  ένας ειδικό για το αμερικανικό φορολογικό δίκαιο. Επίσης μπορεί να χρησιμοποιηθεί το μοντέλο λογικής R1 της DeepSeek για να αποσταγεί από το Llama, προσθέτοντας περισσότερες ικανότητες λογικής. Το AI παίρνει περισσότερο χρόνο για να παράξει μια απάντηση, αμφισβητώντας τη δική του λογική και αναλύει τη διαδικασία για να φτάσει σε μια άλλη απάντηση βήμα προς βήμα.

“Ίσως το πιο ενδιαφέρον κομμάτι του R1 ήταν ότι καταφέραμε να μετατρέψουμε μικρότερα μοντέλα που δεν κάνουν λογική σε μοντέλα λογικής μέσω της βελτίωσής τους με εξόδους από ένα μοντέλο λογικής”, ανέφεραν αναλυτές της SemiAnalysis τον Ιανουάριο.

Εκτός από την προσιτή τιμή — τουλάχιστον για την τεχνητή νοημοσύνη — η DeepSeek δημοσίευσε αποσταγμένα μοντέλα άλλων ανοιχτών πηγών χρησιμοποιώντας το μοντέλο λογικής R1 ως “δάσκαλο”. Τα πλήρη μοντέλα της DeepSeek, καθώς και οι μεγαλύτερες εκδόσεις του Llama, είναι τόσο μεγάλα που μόνο συγκεκριμένος εξοπλισμός μπορεί να τα τρέξει. Η απόσταξη βοηθά και σε αυτό.

“Το αποσταγμένο μοντέλο έχει μικρότερο αποτύπωμα, λιγότερους παραμέτρους, λιγότερη μνήμη”, είπε ο Σαμίρ Κουμάρ, γενικός εταίρος της Touring Capital. “Μπορείς να το τρέξεις στο τηλέφωνό σου. Μπορείς να το τρέξεις σε συσκευές άκρης.”

Η ανακάλυψη της DeepSeek ήταν ότι τα αποσταγμένα μοντέλα δεν χειροτέρεψαν καθώς γίνονταν μικρότερα, όπως αναμενόταν, αντίθετα, έγιναν καλύτερα.

Η απόσταξη δεν είναι νέα απλά έχει αλλάξει

Η τεχνική της απόσταξης εμφανίστηκε για πρώτη φορά σε μια εργασία του 2015 από τους διάσημους βετεράνους της Google AI, Τζεφ Ντιν και Τζεφρί Χίντον, και τον αντιπρόεδρο έρευνας της DeepMind, Όριολ Βινιάλς.

Ο Βινιάλς δήλωσε πρόσφατα ότι η εργασία απορρίφθηκε από το prestigious συνέδριο NeurIPS γιατί δεν θεωρήθηκε ότι είχε σημαντικό αντίκτυπο στον τομέα. Δέκα χρόνια αργότερα, η απόσταση είναι ξαφνικά στην κορυφή της συζήτησης για την τεχνητή νοημοσύνη. Αυτό που κάνει την απόσταξη τόσο ισχυρή τώρα, σε αντίθεση με τότε, είναι ο αριθμός και η ποιότητα των ανοιχτών πηγών μοντέλων που χρησιμοποιούνται ως “δασκάλοι”.

Θερριεύει ο ανταγωνισμός

Η απόσταξη έχει φέρει ευκαιρίες, αλλά αναμένεται να συναντήσει αντιδράσεις λόγω της απειλής που θέτει στα τεράστια, ακριβά, ιδιόκτητα μοντέλα όπως εκείνα που κατασκευάζονται από την OpenAI και την Anthropic.  Υπάρχουν επίσης πιο επιθετικές τακτικές που μπορεί να ακολουθήσουν οι εταιρείες μοντέλων βάσης, όπως ανέφεραν  ερευνητές της Google DeepMind. Οι εταιρείες με μοντέλα λογικής θα μπορούσαν να αφαιρέσουν ή να μειώσουν τα βήματα ή “ίχνη” λογικής που παρουσιάζονται στον χρήστη, ώστε να μην μπορούν να χρησιμοποιηθούν για απόσταξη. Η OpenAI κρύβει το πλήρες μονοπάτι λογικής στο μεγάλο μοντέλο λογικής o1, αλλά έχει κυκλοφορήσει έκδοση μικρότερη, το o3-mini, που δείχνει αυτές τις πληροφορίες.

Παρόλα αυτά, είναι εξαιρετικά δύσκολο να κλειστεί το «τζίνι» της απόσταξης πίσω στο λυχνάρι, καθώς η ανοιχτή άγρια δύση της τεχνητής νοημοσύνης είναι πλέον γεγονός

Πηγή: ot.gr

Διαβάστε επίσης: Ευρώπη: Ποιες βιομηχανίες θα επιβιώσουν της πράσινης μετάβασης; (γράφημα)

Τελευταία Νέα

Τελευταία νέα

Intel: Άλμα 9% για τη μετοχή μετά τη συμφωνία με την Apple για chip στις ΗΠΑ

Intel: Άλμα 9% για τη μετοχή μετά τη συμφωνία με την Apple για chip στις ΗΠΑ

Η Intel κατέγραψε άνοδο έως 9% στις προσυνεδριακές συναλλαγές μετά τη δήλωση Τραμπ ότι συμφώνησε με την Apple για σχεδιασμό…

Από 2.400 σε 7.700 οι εγγεγραμμένοι στο Μητρώο Αγροτών

Από 2.400 σε 7.700 οι εγγεγραμμένοι στο Μητρώο Αγροτών

Σε πλήρη εφαρμογή ο τροποποιητικός νόμος - Διευρύνονται τα κριτήρια συμμετοχής και απλοποιούνται οι διαδικασίες εγγραφής

Πλησιάζουν το μέσο όρο της ΕΕ οι τιμές στην Κύπρο – «Τσιμπάνε» οι τιμές στην εκπαίδευση

Πλησιάζουν το μέσο όρο της ΕΕ οι τιμές στην Κύπρο – «Τσιμπάνε» οι τιμές στην εκπαίδευση

Σύμφωνα με την Eurostat, τα επίπεδα τιμών μεταξύ των κρατών μελών παρουσίασαν σημαντικές αποκλίσεις, κυμαινόμενα από το 140%…

Στην Κύπρο τα πρώτα €177,2 εκατ. από το ευρωπαϊκό ταμείο άμυνας SAFE

Στην Κύπρο τα πρώτα €177,2 εκατ. από το ευρωπαϊκό ταμείο άμυνας SAFE

Η Κομισιόν εκταμίευσε το 15% της συνολικής κατανομής των €1,2 δισ. για αμυντικές επενδύσεις και ενίσχυση των στρατιωτικών…

Ενδιαφέρον από το Οντάριο για επενδύσεις στην Κύπρο

Ενδιαφέρον από το Οντάριο για επενδύσεις στην Κύπρο

Κεραυνός και Fedeli συζήτησαν τρόπους ενίσχυσης των οικονομικών και εμπορικών σχέσεων Κύπρου - Καναδά

Η ΕΕ προσπαθεί να αντιμετωπίσει την Κίνα χωρίς να ξεκινήσει νέο εμπορικό πόλεμο

Η ΕΕ προσπαθεί να αντιμετωπίσει την Κίνα χωρίς να ξεκινήσει νέο εμπορικό πόλεμο

Η οικονομία της Κίνας εξαρτάται σε μεγάλο βαθμό από τις εξαγωγές, δεδομένου ότι η εγχώρια ζήτηση παραμένει χαμηλή, και η…

Πετρέλαιο: Σε πέντε μέρες έχασε όσα κέρδισε σε τρεις μήνες - Πότε θα πέσουν οι τιμές στα πρατήρια

Πετρέλαιο: Σε πέντε μέρες έχασε όσα κέρδισε σε τρεις μήνες - Πότε θα πέσουν οι τιμές στα πρατήρια

Οι καταναλωτές περιμένουν η υποχώρηση του πετρελαίου να αρχίσει να γίνεται αισθητή και στα βενζινάδικα

Βιετνάμ: Η «βασίλισσα» των ακινήτων που χρωστά 27 δισ. δολάρια και βλέπει τις Birkin να βγαίνουν στο σφυρί

Βιετνάμ: Η «βασίλισσα» των ακινήτων που χρωστά 27 δισ. δολάρια και βλέπει τις Birkin να βγαίνουν στο σφυρί

Η Τρουόνγκ Μι Λαν, πρωταγωνίστρια ενός από τα μεγαλύτερα οικονομικά σκάνδαλα παγκοσμίως, βλέπει πολυτελή περιουσιακά στοιχεία…

CLOSE X
CLOSE X
CLOSE X