Offcanvas
Offcanvas

Tech

DeepSeek: Πώς άλλαξε τους κανόνες στην τεχνητή νοημοσύνη με εξωφρενικά χαμηλό budget

DeepSeek: Πώς άλλαξε τους κανόνες στην τεχνητή νοημοσύνη με εξωφρενικά χαμηλό budget

Με μόλις 294.000 δολάρια, η κινεζική startup αμφισβητεί την κυριαρχία της OpenAI και της Nvidia, υπερασπιζόμενη τη μέθοδο «distillation» που μειώνει δραστικά το κόστος ανάπτυξης

Η κινεζική εταιρεία τεχνητής νοημοσύνης DeepSeek αποκάλυψε ότι δαπάνησε μόλις 294.000 δολάρια για την εκπαίδευση του μοντέλου R1, ποσό πολύ χαμηλότερο από τα αντίστοιχα που αναφέρουν αμερικανικοί ανταγωνιστές. Η ανακοίνωση, που δημοσιεύθηκε την Τετάρτη σε άρθρο στο επιστημονικό περιοδικό Nature, αναμένεται να αναζωπυρώσει τη συζήτηση για τη θέση του Πεκίνου στην κούρσα της τεχνητής νοημοσύνης.

Η ενημέρωση αυτή είναι η πρώτη εκτίμηση κόστους που δημοσιοποίησε η εταιρεία με έδρα το Χανγκζού. Η προηγούμενη παρουσίαση των χαμηλού κόστους μοντέλων της, τον Ιανουάριο, είχε προκαλέσει ανησυχία στις αγορές, οδηγώντας σε ρευστοποιήσεις τεχνολογικών μετοχών, καθώς επενδυτές φοβήθηκαν ότι θα απειληθεί η κυριαρχία ηγετών όπως η Nvidia.

Έκτοτε, η εταιρεία και ο ιδρυτής της, Λιανγκ Γουενφένγκ, έχουν κρατήσει χαμηλό προφίλ, δημοσιεύοντας μόνο λίγες ενημερώσεις προϊόντων.

Ο Σαμ Άλτμαν, CEO της OpenAI, είχε δηλώσει το 2023 ότι η εκπαίδευση θεμελιωδών μοντέλων κόστισε «πολύ περισσότερο» από 100 εκατ. δολάρια, χωρίς να δώσει ακριβείς αριθμούς. Το κόστος αφορά τη χρήση clusters από ισχυρά chips για εβδομάδες ή μήνες, ώστε να επεξεργαστούν τεράστιες ποσότητες κειμένων και κώδικα.

Σύμφωνα με το Nature, το μοντέλο R1 κόστισε 294.000 δολάρια για να εκπαιδευτεί σε 512 Nvidia H800 chips. Έκδοση του ίδιου άρθρου τον Ιανουάριο δεν περιλάμβανε τα στοιχεία αυτά.

Ορισμένοι στις ΗΠΑ αμφισβήτησαν τις δηλώσεις της DeepSeek σχετικά με τα κόστη και την τεχνολογία. Τα H800 chips σχεδιάστηκαν από τη Nvidia ειδικά για την Κίνα, μετά την απαγόρευση εξαγωγών των ισχυρότερων H100 και A100 το 2022. Αμερικανοί αξιωματούχοι είχαν ισχυριστεί ότι η DeepSeek απέκτησε παράνομα H100, όμως η Nvidia δήλωσε ότι χρησιμοποιήθηκαν νόμιμα αγορασμένα H800.

Για πρώτη φορά, η εταιρεία αναγνώρισε ότι διαθέτει A100 chips, τα οποία χρησιμοποιήθηκαν στα αρχικά στάδια ανάπτυξης μικρότερου μοντέλου, ενώ το R1 εκπαιδεύτηκε συνολικά για 80 ώρες στο cluster με H800.

Η DeepSeek απάντησε επίσης, έστω έμμεσα, στις κατηγορίες ότι «αντέγραψε» τα μοντέλα της OpenAI μέσω της μεθόδου της distillation, κατά την οποία ένα AI σύστημα μαθαίνει από άλλο, μειώνοντας δραστικά κόστος και χρόνο. Η εταιρεία υπερασπίζεται σταθερά τη μέθοδο ως τρόπο βελτίωσης επιδόσεων και διάδοσης της τεχνητής νοημοσύνης.

Είχε αναφέρει ότι χρησιμοποίησε το ανοιχτού κώδικα μοντέλο Llama της Meta για κάποιες εκδοχές. Στο άρθρο του Nature, η DeepSeek αναφέρει ότι τα δεδομένα εκπαίδευσης του μοντέλου V3 περιλάμβαναν web pages με «σημαντικό αριθμό απαντήσεων που είχαν παραχθεί από μοντέλα της OpenAI», γεγονός που μπορεί να οδήγησε έμμεσα στην ενσωμάτωση γνώσης από ισχυρότερα μοντέλα — υποστηρίζοντας πάντως ότι αυτό δεν έγινε εσκεμμένα.

Πηγή: newmoney.gr

Διαβάστε επίσης: Πόσο αυξήθηκαν οι επιθέσεις σε smartphones το πρώτο εξάμηνο του 2025

Τελευταία Νέα

Τελευταία νέα

Air India: Νέα στρατηγική με φθηνότερα εισιτήρια χωρίς δωρεάν γεύματα για να «χτυπήσει» τις low-cost αεροπορικές

Air India: Νέα στρατηγική με φθηνότερα εισιτήρια χωρίς δωρεάν γεύματα για να «χτυπήσει» τις low-cost αεροπορικές

Η εταιρεία λανσάρει νέα οικονομική κατηγορία εισιτηρίων χωρίς δωρεάν γεύματα, επιδιώκοντας μείωση κόστους και ενίσχυση της…

Στο 3,5% ο πληθωρισμός τον Μάιο – Οι κατηγορίες με τις μεγαλύτερες αυξήσεις

Στο 3,5% ο πληθωρισμός τον Μάιο – Οι κατηγορίες με τις μεγαλύτερες αυξήσεις

Οι μεγαλύτερες αρνητικές μεταβολές καταγράφηκαν στις κατηγορίες Ένδυση και Υπόδηση (-8,5%) και Ενημέρωση και Επικοινωνία…

BofA: Ισχυρή η ζήτηση για το δολάριο

BofA: Ισχυρή η ζήτηση για το δολάριο

Η ζήτηση για το δολάριο παρέμεινε ισχυρή ακόμη και μετά την επίτευξη εκεχειρίας στη Μέση Ανατολή, σύμφωνα με τη BofA

Η JPMorgan βλέπει αξία στις ευρωπαϊκές μετοχές μετά το πετρελαϊκό σοκ

Η JPMorgan βλέπει αξία στις ευρωπαϊκές μετοχές μετά το πετρελαϊκό σοκ

Το ειρηνευτικό deal στη Μέση Ανατολή ανοίγει τον δρόμο για διαφοροποίηση από το trade της τεχνητής νοημοσύνης - Ποιους κλάδους…

Περιόρισε τη ζημιά στον τουρισμό ο Μάιος - «Σωσίβιο» η αγορά του Ισραήλ

Περιόρισε τη ζημιά στον τουρισμό ο Μάιος - «Σωσίβιο» η αγορά του Ισραήλ

Η Κύπρος υποδέχθηκε 178 χιλιάδες λιγότερους επισκέπτες στο πρώτο πεντάμηνο, με την ισραηλινή αγορά να λειτουργεί ως «σωσίβιο»…

«Κράτος Μαφία»: Σε διορισμό ανεξάρτητων ποινικών ανακριτών προχωρά το Υπουργικό - Τι ανακοίνωσε η ΝΥ

«Κράτος Μαφία»: Σε διορισμό ανεξάρτητων ποινικών ανακριτών προχωρά το Υπουργικό - Τι ανακοίνωσε η ΝΥ

Ο Γενικός Εισαγγελέας και ο Βοηθός Γενικός Εισαγγελέας θα απέχουν από οποιαδήποτε αξιολόγηση και λήψη απόφασης σε σχέση με…

Σ. Αγγελίδης για «Κράτος Μαφία»: Προκρίνει διορισμό ανεξάρτητων ποινικών ανακριτών

Σ. Αγγελίδης για «Κράτος Μαφία»: Προκρίνει διορισμό ανεξάρτητων ποινικών ανακριτών

Ο νομικός Σίμος Αγγελίδης επισημαίνει σε δηλώσεις του την αδυναμία της Ανεξάρτητης Αρχής κατά της διαφθοράς στο να προχωρήσει…

Κλείδωσε ο οδικός χάρτης για τα δικαιώματα των επιβατών - Εφαρμογή το 2027, λέει ο Βαφεάδης

Κλείδωσε ο οδικός χάρτης για τα δικαιώματα των επιβατών - Εφαρμογή το 2027, λέει ο Βαφεάδης

Ο Αλέξης Βαφεάδης ανακοίνωσε ότι η συμφωνία που επιτεύχθηκε σε επίπεδο ΕΕ αναμένεται να τεθεί σε ισχύ στις αρχές Ιουλίου…

CLOSE X
CLOSE X
CLOSE X