Phi-3-mini არის გარღვევა Microsoft ხელოვნური ინტელექტის სფეროში?

Phi ხელოვნური ინტელექტის მოდელის მიერ Microsoft - პატარა, იაფი და არ იტანჯება „ჰალუცინაციები“. ასე ამბობენ ახალ ენობრივ მოდელზე, რომელსაც დიდ მომავალს უწინასწარმეტყველებენ.

GPT აბსოლუტურად შესანიშნავია, მაგრამ ამავე დროს, ის საშინლად ძვირია და არ შეიძლება იყოს სრულყოფილი ყველასთვის. ამ და სხვა მრავალი მიზეზის გამო Microsoft ატარებს ექსპერიმენტებს ბევრად უფრო მცირე AI მოდელებზე. ამბობენ, რომ Phi-3-mini შეურაცხყოფს OpenAI ინჟინრების მუშაობას.

ასევე საინტერესოა: მომავლის ტრანზისტორები: ჩიპების ახალი ერა გველოდება

შინაარსი

1. ChatGPT არ არის პანაცეა

2. რა არის ცნობილი Microsoft Phi

3. როგორ გამოვიყენოთ Phi-3-mini?

4. Microsoft ჩაანაცვლებს თუ არა Phi ChatGPT-ის ტიპის მოდელებს?

5. Phi-3-დან Microsoft ესმის მხოლოდ ინგლისური

ChatGPT არ არის პანაცეა

ChatGPT არის გამოგონება, რომელიც დაფინანსებულია, კურირებული და გაუმჯობესებულია Microsoft. სინამდვილეში, ის არ ეკუთვნის Microsoftდა კომპანია OpenAI, რომელიც Microsoft არ ფლობს (ის არის წამყვანი, თუმცა არა ყველაზე დიდი, ინვესტორი). GPT ენის მოდელი მისცა Microsoft გიგანტური უპირატესობა დანარჩენ მსხვილ ტექნოლოგიურ კორპორაციებთან შედარებით, რომლებიც ახლა ჩქარობენ წინსვლას. თუმცა, GPT–სთან დაკავშირებით უამრავი პრობლემაა, რომელთაგან ბევრი ჯერ ვერ მოგვარდება.

პირველ რიგში, ეს არის ძალიან რესურსი ინტენსიური ენის მოდელი. ვებზე ორიენტირებული Microsoft OpenAI-ის Copilot ან ChatGPT წარმოქმნის ძალიან მაღალ საოპერაციო ხარჯებს Microsoft. ეს არის არა მხოლოდ GPT-ის, არამედ ყველა ძირითადი ენობრივი მოდელის მახასიათებელი. გარდა ამისა, GPT, ისევე როგორც მისი კონკურენტები, მიდრეკილია "ჰალუცინაციებისკენ", ანუ მას შეუძლია შექმნას პასუხები შეკითხვებზე, რომლებიც შეიცავს ცრუ ან შეცდომაში შემყვან ინფორმაციას. რაც უფრო მეტ მონაცემს შთანთქავს ასეთი მოდელი, მით მეტია მსგავსი შინაარსის გენერირება. ამიტომ, ჰალუცინაციები და ცრუ განცხადებები არ არის ციფრული თითიდან ამოწურული მითი. მომხმარებლები ხშირად აღნიშნავენ, რომ დიდი ენობრივი მოდელები ხშირად უშვებენ შეცდომებს, აწვდიან არაზუსტ მონაცემებს და მოქმედებს არარსებულ ფაქტებზე.

ორივე პრობლემა ძალიან სერიოზულია, რის გამოც OpenAI, Microsoft, Meta, Google და სხვები მუშაობენ არა მხოლოდ Large Language Model ტექნოლოგიის, არამედ Small Language Model-ის შემუშავებაზე, რომელსაც პრაქტიკაში ბევრად უკეთესი შედეგის მოტანა შეუძლია.

ციფრული ბუღალტერის ასისტენტს არ სჭირდება ბევრი რამ კვანტური ფიზიკის შესახებ. ის შეიძლება იყოს ბევრად უფრო პატარა და ნაკლებად რთული (და შესაბამისად იაფი) და მხოლოდ მისი მიზნისთვის საჭირო მონაცემებზე სწავლებით, თეორიულად ნაკლები ჰალუცინაციები უნდა ჰქონდეს. თუმცა, ამის თქმა უფრო ადვილია, ვიდრე გაკეთება. GenAI ტექნოლოგია ჯერ კიდევ ველური IT საწარმოა. და მიუხედავად იმისა, რომ მუშაობა უპრეცედენტო ტემპით მიმდინარეობს, ფუნდამენტურ საკითხებში პრაქტიკულად გარღვევის მიღწევა მაინც რთულია. მაგრამ კომპანია Microsoft ცოტა ხნის წინ გამოაცხადა ასეთი გარღვევა. საუბარია პატარა ენის მოდელზე Microsoft ფი.

ასევე საინტერესოა: როგორ იბრძვიან ტაივანი, ჩინეთი და აშშ ტექნოლოგიური დომინირებისთვის: დიდი ჩიპური ომი

რა არის ცნობილი Microsoft Phi

პირველ რიგში, უნდა აღინიშნოს, რომ ექსპერიმენტი კომპანია OpenAI-ის მონაწილეობის გარეშე ჩატარდა. ანუ ეს არის ინჟინრების განვითარება Microsoft.

- რეკლამა -

მოდელები Microsoft Phi არის მცირე ენობრივი მოდელების (SLMs) სერია, რომლებიც აღწევენ განსაკუთრებულ შედეგებს სხვადასხვა ტესტებში. პირველ მოდელს, Phi-1-ს ჰქონდა 1,3 მილიარდი პარამეტრი და მიაღწია პითონის კოდირების საუკეთესო შედეგებს არსებულ SLM-ებს შორის.

შემდეგ დეველოპერებმა ყურადღება გაამახვილეს ენის გაგებაზე და აზროვნებაზე, შექმნეს Phi-1.5 მოდელი, რომელსაც ასევე ჰქონდა 1,3 მილიარდი პარამეტრი და აჩვენებდა ეფექტურობას, რომელიც შედარებულია მოდელებთან ხუთჯერ მეტი პარამეტრით.

Phi-2 არის 2,7 მილიარდი პარამეტრიანი მოდელი, რომელიც აჩვენებს მსჯელობისა და ენის გაგების გამორჩეულ შესაძლებლობებს, მუშაობს საუკეთესო საბაზისო მოდელების დონეზე 13 მილიარდი პარამეტრით. Phi-2 გამოირჩევა სხვა მოდელებს შორის მისი ინოვაციების წყალობით მოდელების სკალირებისა და მონაცემთა დამუშავების ტრენინგში.

ის ხელმისაწვდომია Azure AI Studio-ს მოდელების კატალოგში, რაც ხელს უწყობს ენის მოდელების კვლევასა და განვითარებას. Phi-2 ამოქმედდა 2023 წლის დეკემბერში. დეველოპერები ირწმუნებიან, რომ ის მუშაობს ისევე, როგორც Mistral ან Lama 2 Meta-დან. და Phi-3 უფრო კარგად მუშაობს ვიდრე წინა ვერსია.

თუმცა, Phi-3 მოდელი, რომელიც ახლახან გამოცხადდა, სრულიად ახალია ხარისხით. ყოველ შემთხვევაში, ასე შეგიძლიათ განსაჯოთ მოწოდებული ინფორმაციის მიხედვით Microsoft. კომპანიის თქმით, ყველა ცნობილი ნიშნის ინდიკატორის მიხედვით, Phi-3 უკეთესად მუშაობს, ვიდრე მსგავსი ზომის ნებისმიერი სხვა მოდელი, მათ შორის ენის ანალიზი, პროგრამირების სამუშაო ან მათემატიკური სამუშაო.

Phi-3-mini, ამ მოდელის ყველაზე პატარა ვერსია, ახლახან გახდა ხელმისაწვდომი ყველა დაინტერესებული მხარისთვის. ანუ ის ხელმისაწვდომია 23 აპრილიდან. Phi-3-mini-ს აქვს 3,8 მილიარდი პარამეტრი და გაზომვების მიხედვით Microsoft, ორჯერ უფრო ეფექტური, ვიდრე სხვა მსგავსი ზომის მოდელი. ის შეგიძლიათ იხილოთ ღრუბლოვანი სერვისის AI მოდელების კატალოგში Microsoft Azure, Hugging Face მანქანური სწავლების მოდელის პლატფორმა და Ollama, ჩარჩო ლოკალურ კომპიუტერზე მოდელების გასაშვებად.

როგორც ის ამტკიცებს Microsoft, Phi-3-mini არ საჭიროებს მძლავრ ჩიპებს Nvidia. მოდელს შეუძლია იმუშაოს ჩვეულებრივ კომპიუტერულ ჩიპებზე. ან მოერგოს თუნდაც ტელეფონს, რომელიც არ არის დაკავშირებული ინტერნეტთან.

ნაკლები სიმძლავრე ასევე ნიშნავს, რომ მოდელები არ იქნება ისეთი ზუსტი. Phi-3 არ იქნება შესაფერისი ექიმებისთვის ან საგადასახადო ბუღალტრებისთვის, მაგრამ დაგეხმარებათ უფრო მარტივ ამოცანებში. მაგალითად, რეკლამისთვის ან ინტერნეტში მიმოხილვების შეჯამებისთვის.

ვინაიდან პატარა მოდელები საჭიროებენ ნაკლებ დამუშავებას, კერძო კომპანიებისთვის მათი გამოყენება იაფი იქნება. ანუ ში Microsoft იქნება უფრო მეტი მომხმარებელი, ვისაც სურს ხელოვნური ინტელექტის ჩართვა თავის საქმეში, მაგრამ ძალიან ძვირად მიიჩნია. თუმცა, ჯერჯერობით უცნობია, რამდენი დაჯდება ისინი.

ჯერჯერობით უცნობია, როდის გამოჩნდება მცირე და საშუალო მოდელები. მაგრამ ეს უკანასკნელი უფრო ძლიერი და ძვირი იქნება. თუმცა უკვე ცნობილია, რომ Phi-3-small-ს ექნება 7 მილიარდი პარამეტრი, ხოლო Phi-3-medium-ს ექნება 14 მილიარდი პარამეტრი.

- რეკლამა -

ასევე წაიკითხეთ:

როგორ გამოვიყენოთ Phi-3-mini?

GPT-4 Turbo-ს სჭირდება ძლიერი AI ჩიპები, რომლებიც ჯერ კიდევ ძალიან ძვირია. Phi-3 მცირე მეტყველების მოდელს შეუძლია იმუშაოს ოფლაინში, ღრუბლის გარეშე, თუნდაც მობილური ტელეფონის ჩიპით.

Phi-3 არ არის პროდუქტი საბოლოო მომხმარებლებისთვის, არამედ ტექნოლოგია, რომელიც დეველოპერებს შეეძლებათ გამოიყენონ და დანერგონ თავიანთ აპლიკაციებში - როგორც ღრუბელზე დაფუძნებული, ანუ დისტანციურად განლაგებული, ასევე ის, ვინც მუშაობს ადგილობრივად და ოფლაინზე. მოსალოდნელია, რომ ის შეუფერხებლად იმუშავებს მოწყობილობებთან და მათ კომპონენტებთან, როგორიცაა მობილური ტელეფონები, მანქანები და მათი საინფორმაციო გასართობი სისტემები, ან თუნდაც IoT სენსორები. ზოგიერთ შემთხვევაში, ეს ტექნოლოგია შეიძლება იყოს ფასდაუდებელი.

Microsoft კონკრეტულ მაგალითსაც კი მოჰყავს, რომ ფანტაზია არ დავიძაბოდეთ. წარმოიდგინეთ, ფერმერი ათვალიერებს თავის მოსავალს და ხედავს დაავადების ნიშნებს ფოთლებზე, ღეროებსა და ტოტებზე. სატელეკომუნიკაციო ანძებისგან შორს ყოფნისას, მას მხოლოდ ტელეფონის ამოღება დასჭირდება, დაზიანების სურათის გადაღება, აპლიკაციაში ჩასმა, რომელიც იყენებს Phi-3 ტექნოლოგიას - და მოდელი სწრაფად და ოფლაინ გააანალიზებს ფოტოს და რჩევას მოგცემთ. როგორ ვებრძოლოთ ამ დაავადებას.

როგორც ის განმარტავს MicrosoftGPT-ის წარმატების გასაღები იყო მასიური მოცულობის მონაცემების გამოყენება ტრენინგისთვის. მონაცემთა ასეთი დიდი ნაკრებით, მონაცემთა მაღალი ხარისხი გამორიცხულია. იმავდროულად, Phi მოდელის სწავლებისას გამოყენებული იქნა სრულიად საპირისპირო OpenAI მიდგომა. იმის მაგივრად, რომ მოდელი შეავსოთ ინფორმაცია, აქცენტი გაკეთდა დამატებით და საფუძვლიან სწავლაზე.

მკვლევარებმა ინტერნეტის ნედლი მონაცემების გამოყენების ნაცვლად Microsoft შექმნა TinyStories-ის მონაცემთა ნაკრები, რომელმაც შექმნა მილიონობით მინიატურული „ბავშვის“ ისტორია. ეს ისტორიები გამოიყენებოდა ძალიან მცირე ენობრივი მოდელების მოსამზადებლად. შემდეგ მკვლევარები უფრო შორს წავიდნენ და შექმნეს CodeTextbook მონაცემთა ნაკრები, რომელიც იყენებდა ყურადღებით შერჩეულ, საჯაროდ ხელმისაწვდომ მონაცემებს, რომლებიც გაფილტრული იყო საგანმანათლებლო ღირებულებისა და შინაარსის ხარისხისთვის. ეს მონაცემები შემდეგ რამდენჯერმე გაფილტრული იყო და კვლავ იკვებებოდა დიდ ენობრივ მოდელში (LLM) შემდგომი სინთეზისთვის.

ამ ყველაფერმა შესაძლებელი გახადა მონაცემთა მასივის შექმნა, რომელიც საკმარისია უფრო ეფექტური SLM-ის მოსამზადებლად. გარდა ამისა, Phi-3 მოდელის შემუშავებისას გამოყენებული იქნა რისკის მართვისა და შერბილების მრავალ დონის მიდგომა, მათ შორის შეფასება, ტესტირება და ხელით კორექტირება. შედეგად, როგორც ის აცხადებს Microsoftდეველოპერებს, რომლებიც იყენებენ Phi-3 მოდელების ოჯახს, შეუძლიათ ისარგებლონ Azure AI-ში არსებული ხელსაწყოებით, რათა შექმნან უფრო უსაფრთხო და საიმედო აპლიკაციები.

ასევე წაიკითხეთ: ტელეპორტაცია სამეცნიერო თვალსაზრისით და მისი მომავალი

Microsoft ჩაანაცვლებს თუ არა Phi ChatGPT-ის ტიპის მოდელებს?

Არაფერს. მცირე ენების მოდელებს (SLM), მაშინაც კი, როცა მაღალხარისხიან მონაცემებზე ვარჯიშობენ, აქვთ შეზღუდვები და არ არის შექმნილი ღრმა სწავლისთვის. დიდი ენობრივი მოდელები (LLMs) აღემატება SLM-ებს კომპლექსურ მსჯელობაში მათი ზომისა და გამოთვლითი სიმძლავრის გამო. LLM-ები არის და იქნება განსაკუთრებით სასარგებლო ისეთ სფეროებში, როგორიცაა ნარკოტიკების აღმოჩენა, სადაც საჭიროა სამეცნიერო ნაშრომების უზარმაზარი კოლექციების ძიება და რთული ნიმუშების ანალიზი. მეორეს მხრივ, SLM შეიძლება გამოყენებულ იქნას უფრო მარტივი ამოცანებისთვის, როგორიცაა გრძელი ტექსტური დოკუმენტის ძირითადი პუნქტების შეჯამება, შინაარსის შექმნა ან მომხმარებელთა მომსახურების ჩეთბოტების გაძლიერება.

Microsoftმისი თქმით, უკვე იყენებს შიდა მოდელების ჰიბრიდულ კომპლექტს, სადაც LLM ლიდერობს და მიმართავს გარკვეულ მოთხოვნებს, რომლებიც ნაკლებ გამოთვლით ძალას მოითხოვს SLM-ზე, ხოლო ის თავად ამუშავებს სხვა, უფრო რთულ მოთხოვნებს. Phi განლაგებულია მოწყობილობებზე გამოთვლებისთვის, ღრუბლის გამოყენების გარეშე. თუმცა, მაინც იქნება უფსკრული მცირე ენის მოდელებსა და ინტელექტის დონეს შორის, რომლის მიღებაც შესაძლებელია ღრუბელში დიდი მოდელებით. ეს უფსკრული, LLM-ის უწყვეტი განვითარების წყალობით, ნაკლებად სავარაუდოა, რომ მალე გაქრეს.

Phi-3 ჯერ კიდევ არ არის გადამოწმებული გარე დამოუკიდებელი მხარეების მიერ. Microsoft ზოგჯერ საუბარია 25-ჯერ უფრო მაღალ ეფექტურობაზე ან ენერგოეფექტურობაზე ექსტრემალურ შემთხვევებში, კონკურენტებთან შედარებით, რაც საკმაოდ ზღაპრულად ჟღერს. თუმცა, მეორე მხრივ, არ შეიძლება დაივიწყოს, რომ ეს წლები გავიდა Microsoft ცოტათი დაგვაშორა ის ფაქტი, რომ ის აშკარა ლიდერია IT ინოვაციების მხრივ და შესაძლოა ამიტომაც არ გვჯერა ამის. AI-ზე დაფუძნებული პროგრამები, რომლებიც მყისიერად რეაგირებენ და გენერირების ნაცვლად მუშაობს ოფლაინზე? ეს იქნებოდა დღევანდელი რევოლუციის ღირსეული კულმინაცია. სამწუხაროდ, არის ერთი ძირითადი პრობლემა.

ასევე წაიკითხეთ: ყველაფერი Neuralink Telepathy ჩიპის შესახებ: რა არის და როგორ მუშაობს

Phi-3-დან Microsoft ესმის მხოლოდ ინგლისური

Phi-3-მა მასზე მასობრივად გადაყრილი პეტაბაიტები არ წალეკა. მოდელის ფრთხილად და სკრუპულოზური ვარჯიში ერთ უმნიშვნელო პრობლემას მოიცავს. Phi-3 გავლილი აქვს ტრენინგები ინგლისურ ენაზე და ჯერ არ აქვს წარმოდგენა სხვა ენაზე. არა მარტო უკრაინული, არამედ გერმანული, ესპანური, ფრანგული თუ ჩინური. რა თქმა უნდა, ეს მნიშვნელოვნად ამცირებს მის მიმზიდველობას მთელს მსოფლიოში მომხმარებლების უმეტესობისთვის.

მაგრამ შიგნით Microsoft დაარწმუნა, რომ მის განვითარებასა და გაუმჯობესებაზე მუშაობა მიმდინარეობს. თუმცა არ უნდა მოიტყუოთ თავი იმით, რომ უკრაინის ბაზარი პრიორიტეტულია ნებისმიერი მსხვილი კორპორაციისთვის. ამიტომ, უკრაინული ენის მხარდაჭერისთვის ძალიან დიდხანს მოგვიწევს ლოდინი. მაგრამ ამ ფაქტს არასოდეს შეუწყვეტია ენთუზიასტები და მათ, ვისაც სურს წინსვლა.

ასევე წაიკითხეთ:

მეტი ავტორისგან

დარეგისტრირდით

0 კომენტარები

ჩაშენებული მიმოხილვები

ყველა კომენტარის ნახვა

სხვა სტატიები