Google-მა ახლახან გამოუშვა ყველაზე ძლიერი ხელოვნური ინტელექტის მოდელი ტყუპები. რა არის ის და რისი გაკეთება შეუძლია? ყველაფრის შესახებ ჩვენს სტატიაში.
Google წლების განმავლობაში ავითარებს საკუთარ AI ინსტრუმენტებს. OpenAI-სგან ChatGPT-3-ის საჯარო გამოშვებით, კომპანიამ, რომელიც მართავს მსოფლიოში ყველაზე პოპულარულ საძიებო სისტემას, ასევე შექმნა მსგავსი ინსტრუმენტი, Bard. მაგრამ ეს ინსტრუმენტი მაინც წააგო კონკურენტებთან, რაც Google-მა ვერ დაუშვა. ამიტომ გასაკვირი არ არის, რომ მსოფლიომ ცოტა ხნის წინ იხილა Gemini, Google-ის ახალი ენობრივი მოდელი, რომლის შესახებაც პრეზენტაციის დროს შევიტყვეთ.
ის შექმნილია არა მხოლოდ გიგანტის წინა LLM (Large Language Model) გასაუმჯობესებლად, არამედ სრულიად ახალი შესაძლებლობების შეთავაზებისთვის ტექსტის დამუშავების, გრაფიკისა და ხმის სფეროში.
ასე რომ, მოდით, უფრო ახლოს მივხედოთ Google Gemini ენის ახალ მოდელს.
ასევე საინტერესოა: OpenAI Project Q*: რა არის ეს და რატომ არის პროექტი შემაშფოთებელი
ეს არის Google-ის ხელოვნური ინტელექტის ახალი და მძლავრი მოდელი, რომელსაც შეუძლია გაიგოს არა მხოლოდ ტექსტი, არამედ სურათები, ვიდეო და აუდიო. ეს მულტიმოდალური მოდელი აღწერილია, როგორც რთული ამოცანების შესრულება მათემატიკაში, ფიზიკასა და სხვა დომენებში, ასევე, გაიგებს და გენერირებს მაღალი ხარისხის კოდის სხვადასხვა პროგრამირების ენაზე.
Gemini ამჟამად ხელმისაწვდომია Google Bard-თან და Google Pixel 8-თან ინტეგრაციის გზით და თანდათან ჩაერთვება Google-ის სხვა სერვისებში.
„ტყუპები არის Google-ის გუნდების, მათ შორის ჩვენი კოლეგების ჩათვლით, Google Research-ის დიდი ერთობლივი ძალისხმევის შედეგი“, — თქვა დენის ჰასაბისმა, აღმასრულებელმა დირექტორმა და Google DeepMind-ის თანადამფუძნებელმა. „ის აშენდა თავიდანვე მულტიმოდალურისთვის, რაც იმას ნიშნავს, რომ მას შეუძლია განზოგადოს და შეუფერხებლად გაიგოს, იმოქმედოს და დააკავშიროს სხვადასხვა ტიპის ინფორმაცია, მათ შორის ტექსტი, კოდი, აუდიო, სურათები და ვიდეო.
ასევე საინტერესოა: ყველაფერს, რასაც ჩვენ AI-ს ვუწოდებთ, სინამდვილეში ხელოვნური ინტელექტი არ არის. აი, რა უნდა იცოდეთ
როგორც ალბათ უკვე მიხვდით, Gemini შეიქმნა Google-ისა და Alphabet-ის მიერ, Google-ის მშობელი კომპანიის მიერ და არის კომპანიის ყველაზე მოწინავე AI მოდელი დღემდე. მის განვითარებაში მნიშვნელოვანი წვლილი შეიტანა Google-ის DeepMind განყოფილებამ. ჯერჯერობით უცნობია რამდენი თანამშრომელი მონაწილეობდა განვითარებაში და რა თანხები გამოიყო ამისთვის, მაგრამ Google-ის შესაძლებლობების გაცნობით შეგვიძლია დავრწმუნდეთ, რომ ძალიან დიდი თანხაა.
ასევე საინტერესოა: Windows 12: რა იქნება ახალი OS
როგორც ზემოთ აღვნიშნე, ეს არის მულტიმოდალური მოდელი, რაც იმას ნიშნავს, რომ მას შეუძლია გაიგოს, იმოქმედოს და დააკავშიროს სხვადასხვა ტიპის მონაცემები, მათ შორის ტექსტი, კოდი, აუდიო, სურათები და ვიდეო. ის უზრუნველყოფს უკეთ გაგებას, აზროვნებას და კოდირების უნარებს წინა AI სისტემებთან შედარებით.
მოდელის ძირითადი შესაძლებლობებია:
როგორც ხედავთ, შესაძლებლობები აღემატება სხვა მოდელებს.
ენის გაგების, მათემატიკური აზროვნებისა და კოდირების ტესტებში Gemini Ultra-მ აჯობა მოდელებს, როგორიცაა GPT-4. კერძოდ, ეს არის პირველი მოდელი, რომელმაც აჯობა ადამიანის დონის შესრულებას Massive Multitask Language Understanding (MMLU) ტესტზე და მიაღწია 90%-ზე მეტ სიზუსტეს.
დიდი ენის მოდელის კვლევის 32 აკადემიურ ტესტში ტყუპებმა აჯობა GPT-4-ს. 30 შემთხვევაში Google-ის ახალი ენის მოდელი კონკურენტზე უკეთესი იყო. ეს აჩვენებს მოდელის უნარს სრულად გაიგოს ენა.
ასევე წაიკითხეთ: ადამიანის ტვინის პროექტი: ადამიანის ტვინის იმიტაციის მცდელობა
Google აღწერს ამ AI-ს, როგორც მოქნილ მოდელს, რომელსაც შეუძლია იმუშაოს ნებისმიერ მოწყობილობაზე: Google-ის მონაცემთა ცენტრებიდან მობილურ მოწყობილობებამდე. ამ მასშტაბურობის მისაღწევად, Gemini გამოდის სამ ვერსიაში: Nano, Pro და Ultra.
მოდით ვისაუბროთ ტყუპების სხვადასხვა ვერსიებზე უფრო დეტალურად.
ასევე საინტერესოა: Google Bard AI: ყველაფერი რაც თქვენ უნდა იცოდეთ
ხელოვნური ინტელექტი Nano და Pro ვერსიებში ახლა უკვე ხელმისაწვდომია Google-ის პროდუქტებში, როგორიცაა Google Pixel 8 სმარტფონები და Bard chatbot, შესაბამისად. Google გეგმავს მის საბოლოოდ ინტეგრირებას საძიებო სისტემაში, რეკლამაში, Gmail ელფოსტის სერვისში, Chrome ბრაუზერში და სხვა სერვისებში.
დეველოპერები და საწარმოს მომხმარებლები შეძლებენ Pro-ზე წვდომას Gemini API-ით Google AI Studio-სა და Google Cloud Vertex AI-ში 13 წლის 2023 დეკემბრიდან. დეველოპერები Android ექნება წვდომა Nano ვერსიის მოდელზე AICore-ის საშუალებით, რომელიც ხელმისაწვდომი იქნება ადრეული გადახედვისას.
ასევე წაიკითხეთ: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: ორი იოკოძუნის ბრძოლა
პრეზენტაციის დროს მოწოდებული ინფორმაციის თანახმად, მოდელი Google Bard-ს საშუალებას მისცემს უკეთ გაუმკლავდეს უფრო რთულ პრობლემებს, როგორც ნათქვამია:
„ჩვენ შევქმენით Gemini ისე, რომ მოდელი ბუნებრივად იყოს მრავალმოდალური და თავიდანვე წინასწარ მომზადებული მრავალ მოდალობაზე. ჩვენ შემდეგ დახვეწეთ ის მეტი მულტიმოდალური მონაცემების დამატებით შესრულების გასაუმჯობესებლად. შედეგად, ტყუპები ადვილად ესმით და გამოიტანს დასკვნებს ბევრად უკეთ, ვიდრე წინა მულტიმოდალური მოდელები და ამაყობს უახლესი შესაძლებლობებით თითქმის ყველა სფეროში.
ტყუპების არაჩვეულებრივი მულტიმოდალური შესაძლებლობები გეხმარებათ რთული ტექსტური და ვიზუალური ინფორმაციის გაგებაში. ისინი განსაკუთრებით სასარგებლოა, როდესაც საქმე ეხება მონაცემთა უზარმაზარი ნაკრებიდან კონკრეტული ინფორმაციის მოპოვებას. ამ მოდელის არაჩვეულებრივი უნარი ამოიღოს ინფორმაციის არსი ასიათასობით დოკუმენტიდან მათი წაკითხვით, გაფილტვრით და ანალიზით, უდავოდ ხელს შეუწყობს ახალ, ელვისებურად სწრაფ აღმოჩენებს სხვადასხვა სფეროში, მეცნიერებიდან ფინანსებამდე.
პრეზენტაციის დროს აჩვენეს კომპლექსური კვლევის მაგალითი, რომელიც შეიცავს 200 ათასზე მეტ ჩანაწერს, რომელთაგან ზოგიერთი განახლება ახალი მონაცემების მიხედვით უნდა მომხდარიყო. როგორც თქვენ ალბათ მიხვდით, ამის ხელით გაკეთება ძალიან შრომატევადი იქნებოდა, ამიტომ კვლევის ავტორებმა გამოიყენეს Gemini კოდის მოსამზადებლად, რომელიც იღებდა შენატანს და აკეთებდა საჭირო განახლებებს. კიდევ ერთი, უფრო რეალური მაგალითია Google-ის ენის მოდელის გამოყენება მათემატიკური ან ფიზიკის პრობლემების ასახსნელად.
აქ შეყვანილი მონაცემები იყო სკოლის გაკვეთილიდან მიღებული დავალების ფოტო/სკანირება. სისტემამ შეძლო იქ შენახული გრაფიკისა და ტექსტის დამუშავება და შემდეგ მიუთითა საშინაო დავალების რომელი ნაწილები იყო სწორად შესრულებული და რომელს მეტი ყურადღება სჭირდებოდა. პრეზენტაციამ აჩვენა, რომ მომხმარებელს შეუძლია არაერთხელ სთხოვოს ტყუპებს დავალების ახსნა და ყოველი შემდგომი მცდელობა უფრო მარტივი ენით უნდა იყოს ახსნილი. რამდენად ზუსტი და სწორი იქნება ტყუპები, რა თქმა უნდა, დაინტერესებულები შეამოწმებენ, მაგრამ ტექსტის წაკითხვისა და უშუალოდ ფოტოებიდან დამუშავების უნარი შთამბეჭდავია. როგორც დამატებულია პრეზენტაციის დროს:
"ტყუპებს ასწავლეს ტექსტის, სურათების, ბგერების და სხვათა ამოცნობა და გაგება ერთდროულად. ამის წყალობით, ის უკეთ ესმის ინფორმაციის ნიუანსებს და შეუძლია უპასუხოს რთულ კითხვებს. ის განსაკუთრებით ეფექტურია მათემატიკასთან და ფიზიკასთან დაკავშირებული თემების ასახსნელად, ასე რომ, ის შეიძლება იყოს პირადი საშინაო დავალების დამხმარე.".
Google-მა ასევე დაიკვეხნა, რომ Gemini „სწავლობდა“ ახალ TPUv5 ჩიპსეტებზე და გეგმავს Gemini Ultra-ს წარდგენას 2024 წლის დასაწყისში, რომელიც გამოიყენებს Bard Advanced-ს, გიგანტის მეტყველების მოდელის სამომხმარებლო ვერსიის ახალ ვერსიას. Gemini Ultra ამჟამად ტესტირების პროცესშია და უკვე ხელმისაწვდომია უსაფრთხოების ექსპერტების შერჩევისთვის.
ბოლო მნიშვნელოვანი ინფორმაცია არის Gemini-ის დანერგვა Google Pixel 8 სმარტფონებში. ეს საშუალებას მისცემს, სხვა საკითხებთან ერთად, შექმნას სწრაფი პასუხები მესინჯერებში Gboard აპლიკაციის მეშვეობით. პირველი არის WhatsApp, მაგრამ მომავალ წელს ასეთი გადაწყვეტილებები გამოჩნდება კომუნიკაციასთან დაკავშირებულ სხვა აპლიკაციებში. თუმცა, ეს მხოლოდ დასაწყისია, რადგან Google-მა გამოაცხადა მრავალი ახალი AI ინსტრუმენტი Pixel 8 სმარტფონებისთვის და ისინი მომავალში ხელმისაწვდომი იქნება ზოგიერთ სხვა მოწყობილობაზე. Android. თუმცა, ეს არის შემდგომი გეგმები და ამ დროისთვის დეტალები არ არის მოწოდებული.
Google-ის ახალი Gemini მოდელი, როგორც ჩანს, ერთ-ერთი ყველაზე დიდი და მოწინავე AI მოდელია დღემდე, თუმცა Ultra მოდელის გამოშვება ამას ნამდვილად განსაზღვრავს. სხვა პოპულარულ მოდელებთან შედარებით, რომლებიც ამჟამად იყენებენ AI ჩეთბოტებს, Gemini გამოირჩევა საკუთარი მულტიმოდალური ფუნქციით, ხოლო სხვა მოდელები, როგორიცაა GPT-4, ეყრდნობა დანამატებს და ინტეგრაციას, რათა იყოს ჭეშმარიტად მულტიმოდალური.
მიუხედავად იმისა, რომ Gemini არის მნიშვნელოვანი წინსვლა ხელოვნური ინტელექტის შესაძლებლობების განვითარებაში, მას აქვს იგივე ნაკლოვანებები, როგორც სხვა ძირითად ენობრივ მოდელებს. პირველ რიგში, ეს არის ყალბი ინფორმაციის შექმნის შესაძლებლობა. მიკერძოება ასევე ეფუძნება ტრენინგის მონაცემებს, რომლებიც ხელმისაწვდომია ახალი ენის მოდელისთვის. ასევე აღსანიშნავია რეალური სამყაროს შეზღუდული გაგება. Google აღიარებს, რომ ტყუპების ახალ მოდელს შეუძლია შეცდომები დაუშვას, მოგვაწოდოს ფაქტები, რომლებიც არ არის დაფუძნებული მტკიცებულებებზე და ეწინააღმდეგება საღ აზრს.
საჭიროა მეტი ტესტები, განსაკუთრებით Gemini Ultra-სთვის, რომელსაც აქვს ახალი შესაძლებლობები, რომლებიც ჯერ ბოლომდე არ არის შესწავლილი. Google მზად არის გულდასმით შეაფასოს ტყუპები, რათა მინიმუმამდე დაიყვანოს პოტენციური ზიანი.
ასევე საინტერესოა: ყველაფერი Microsoft კოპილოტი: მომავალი თუ არასწორი გზა?
Google-ის მიერ Gemini-ის გაშვებამ AI განვითარების ახალი ერა დაიწყო. წინა მოდელებთან და ადამიანის საბაზისო ხაზებთან შედარებით თავისი საუკეთესო შესრულებით, Gemini მიუთითებს ხელოვნური ინტელექტის სამომავლო შესაძლებლობებზე, მაგრამ მაინც სჭირდება მეტი კვლევა გარკვეული ხარვეზების გამოსასწორებლად.
სამომავლოდ, შეგიძლიათ ველოდოთ Gemini-ს Google-ის პროდუქტებში უფრო სასარგებლო და ინტელექტუალურ ფუნქციებს. მომავალში, კომპანია გეგმავს გააგრძელოს Gemini-ის გაფართოება ინგლისური ენის მიღმა და დაეყრდნოს მისი ძირითადი მოდელის მეთოდოლოგიას.
ჩვენ შეგვიძლია მხოლოდ ვუყუროთ და ვიმედოვნებთ, რომ Google-მა იცის რას აკეთებს.
ასევე წაიკითხეთ:
დატოვე პასუხი