რა არის Gemini: ყველაფერი Google-ის ახალი AI მოდელის შესახებ

08/02/2024 22:28

Google-მა ახლახან გამოუშვა ყველაზე ძლიერი ხელოვნური ინტელექტის მოდელი ტყუპები. რა არის ის და რისი გაკეთება შეუძლია? ყველაფრის შესახებ ჩვენს სტატიაში.

Google წლების განმავლობაში ავითარებს საკუთარ AI ინსტრუმენტებს. OpenAI-სგან ChatGPT-3-ის საჯარო გამოშვებით, კომპანიამ, რომელიც მართავს მსოფლიოში ყველაზე პოპულარულ საძიებო სისტემას, ასევე შექმნა მსგავსი ინსტრუმენტი, Bard. მაგრამ ეს ინსტრუმენტი მაინც წააგო კონკურენტებთან, რაც Google-მა ვერ დაუშვა. ამიტომ გასაკვირი არ არის, რომ მსოფლიომ ცოტა ხნის წინ იხილა Gemini, Google-ის ახალი ენობრივი მოდელი, რომლის შესახებაც პრეზენტაციის დროს შევიტყვეთ.

ის შექმნილია არა მხოლოდ გიგანტის წინა LLM (Large Language Model) გასაუმჯობესებლად, არამედ სრულიად ახალი შესაძლებლობების შეთავაზებისთვის ტექსტის დამუშავების, გრაფიკისა და ხმის სფეროში.

ასე რომ, მოდით, უფრო ახლოს მივხედოთ Google Gemini ენის ახალ მოდელს.

ასევე საინტერესოა: OpenAI Project Q*: რა არის ეს და რატომ არის პროექტი შემაშფოთებელი

შინაარსი

1. რა არის Google Gemini?

2. ვინ შექმნა მოდელი?

3. Შესაძლებლობები

4. არის სხვადასხვა ვერსიები?

5. როგორ მივიღოთ ტყუპები?

6. ტყუპები Google Bard-ში: რა შეიცვლება?

7. ტყუპები Google Pixel სმარტფონებში

8. რით განსხვავდება Gemini სხვა AI მოდელებისგან, როგორიცაა GPT-4?

9. შეშფოთება სიზუსტისა და მიუკერძოებლობის შესახებ

10. მომავალი ტყუპებთანაა

რა არის Google Gemini?

ეს არის Google-ის ხელოვნური ინტელექტის ახალი და მძლავრი მოდელი, რომელსაც შეუძლია გაიგოს არა მხოლოდ ტექსტი, არამედ სურათები, ვიდეო და აუდიო. ეს მულტიმოდალური მოდელი აღწერილია, როგორც რთული ამოცანების შესრულება მათემატიკაში, ფიზიკასა და სხვა დომენებში, ასევე, გაიგებს და გენერირებს მაღალი ხარისხის კოდის სხვადასხვა პროგრამირების ენაზე.

Gemini ამჟამად ხელმისაწვდომია Google Bard-თან და Google Pixel 8-თან ინტეგრაციის გზით და თანდათან ჩაერთვება Google-ის სხვა სერვისებში.

„ტყუპები არის Google-ის გუნდების, მათ შორის ჩვენი კოლეგების ჩათვლით, Google Research-ის დიდი ერთობლივი ძალისხმევის შედეგი“, — თქვა დენის ჰასაბისმა, აღმასრულებელმა დირექტორმა და Google DeepMind-ის თანადამფუძნებელმა. „ის აშენდა თავიდანვე მულტიმოდალურისთვის, რაც იმას ნიშნავს, რომ მას შეუძლია განზოგადოს და შეუფერხებლად გაიგოს, იმოქმედოს და დააკავშიროს სხვადასხვა ტიპის ინფორმაცია, მათ შორის ტექსტი, კოდი, აუდიო, სურათები და ვიდეო.

ასევე საინტერესოა: ყველაფერს, რასაც ჩვენ AI-ს ვუწოდებთ, სინამდვილეში ხელოვნური ინტელექტი არ არის. აი, რა უნდა იცოდეთ

ვინ შექმნა მოდელი?

როგორც ალბათ უკვე მიხვდით, Gemini შეიქმნა Google-ისა და Alphabet-ის მიერ, Google-ის მშობელი კომპანიის მიერ და არის კომპანიის ყველაზე მოწინავე AI მოდელი დღემდე. მის განვითარებაში მნიშვნელოვანი წვლილი შეიტანა Google-ის DeepMind განყოფილებამ. ჯერჯერობით უცნობია რამდენი თანამშრომელი მონაწილეობდა განვითარებაში და რა თანხები გამოიყო ამისთვის, მაგრამ Google-ის შესაძლებლობების გაცნობით შეგვიძლია დავრწმუნდეთ, რომ ძალიან დიდი თანხაა.

ასევე საინტერესოა: Windows 12: რა იქნება ახალი OS

Შესაძლებლობები

როგორც ზემოთ აღვნიშნე, ეს არის მულტიმოდალური მოდელი, რაც იმას ნიშნავს, რომ მას შეუძლია გაიგოს, იმოქმედოს და დააკავშიროს სხვადასხვა ტიპის მონაცემები, მათ შორის ტექსტი, კოდი, აუდიო, სურათები და ვიდეო. ის უზრუნველყოფს უკეთ გაგებას, აზროვნებას და კოდირების უნარებს წინა AI სისტემებთან შედარებით.

მოდელის ძირითადი შესაძლებლობებია:

ბუნებრივი ენის დამუშავება ისეთი ამოცანებისთვის, როგორიცაა თარგმანი, შეჯამება და დიალოგი
მათემატიკური აზროვნება და პრობლემის გადაჭრა
კოდისა და დოკუმენტაციის გენერირების შესაძლებლობა
სურათების, აუდიოსა და ვიდეოს გაგება
მრავალდავალება სხვადასხვა დომენში

როგორც ხედავთ, შესაძლებლობები აღემატება სხვა მოდელებს.

ენის გაგების, მათემატიკური აზროვნებისა და კოდირების ტესტებში Gemini Ultra-მ აჯობა მოდელებს, როგორიცაა GPT-4. კერძოდ, ეს არის პირველი მოდელი, რომელმაც აჯობა ადამიანის დონის შესრულებას Massive Multitask Language Understanding (MMLU) ტესტზე და მიაღწია 90%-ზე მეტ სიზუსტეს.

დიდი ენის მოდელის კვლევის 32 აკადემიურ ტესტში ტყუპებმა აჯობა GPT-4-ს. 30 შემთხვევაში Google-ის ახალი ენის მოდელი კონკურენტზე უკეთესი იყო. ეს აჩვენებს მოდელის უნარს სრულად გაიგოს ენა.

ასევე წაიკითხეთ: ადამიანის ტვინის პროექტი: ადამიანის ტვინის იმიტაციის მცდელობა

არის სხვადასხვა ვერსიები?

Google აღწერს ამ AI-ს, როგორც მოქნილ მოდელს, რომელსაც შეუძლია იმუშაოს ნებისმიერ მოწყობილობაზე: Google-ის მონაცემთა ცენტრებიდან მობილურ მოწყობილობებამდე. ამ მასშტაბურობის მისაღწევად, Gemini გამოდის სამ ვერსიაში: Nano, Pro და Ultra.

მოდით ვისაუბროთ ტყუპების სხვადასხვა ვერსიებზე უფრო დეტალურად.

ტყუპები ნანო: შექმნილია სმარტფონებზე, კერძოდ, Google Pixel 8-ზე მუშაობისთვის. შექმნილია ამოცანების შესასრულებლად, რომლებიც საჭიროებს ეფექტურ დამუშავებას ხელოვნური ინტელექტის მიერ გარე სერვერებთან დაკავშირების გარეშე, როგორიცაა პასუხების შეთავაზება ჩატის პროგრამებში ან ტექსტის შეჯამება. ამ კომპაქტური მოწყობილობის მოდელს აქვს დაახლოებით 6 მილიარდი პარამეტრი.
ტყუპები პრო: მუშაობს Google მონაცემთა ცენტრებში. Pro შექმნილია Bard AI ჩეთბოტის უახლეს ვერსიასთან მუშაობისთვის. მას შეუძლია უზრუნველყოს სწრაფი რეაგირების დრო და გაიგოს რთული მოთხოვნები. საშუალო ზომის მოდელს აქვს დაახლოებით 100 მილიარდი პარამეტრი და წარმოადგენს ბარდის სასაუბრო AI-ს ბირთვს. Pro ხელმისაწვდომი იქნება Google Cloud-ის მეშვეობით.
ტყუპები ულტრა: მიუხედავად იმისა, რომ Ultra ვერსია ჯერ არ არის ფართოდ ხელმისაწვდომი, Google აღწერს მას, როგორც მის საუკეთესო მოდელს, რომელიც აღემატება "მიმდინარე თანამედროვე დონეს 30-დან 32 ფართოდ გამოყენებული აკადემიური ტესტისთვის, რომლებიც გამოიყენება დიდი ენის მოდელის (LLM) კვლევაში. " როგორც ყველაზე დიდი და მძლავრი ვერსია, Ultra მიიღებს 1 ტრილიონზე მეტ პარამეტრს. ის განთავსდება მონაცემთა ცენტრებში. Ultra ადაპტირებულია კორპორატიული გამოყენებისთვის. ვერსია შექმნილია ძალიან რთული ამოცანების შესასრულებლად. Google გეგმავს მის გამოშვებას მიმდინარე ტესტირების ფაზის დასრულების შემდეგ. ანუ, ყველაზე ძლიერი ვერსია ჯერ არ არის ხელმისაწვდომი მომხმარებლებისთვის.

ასევე საინტერესოა: Google Bard AI: ყველაფერი რაც თქვენ უნდა იცოდეთ

როგორ მივიღოთ ტყუპები?

ხელოვნური ინტელექტი Nano და Pro ვერსიებში ახლა უკვე ხელმისაწვდომია Google-ის პროდუქტებში, როგორიცაა Google Pixel 8 სმარტფონები და Bard chatbot, შესაბამისად. Google გეგმავს მის საბოლოოდ ინტეგრირებას საძიებო სისტემაში, რეკლამაში, Gmail ელფოსტის სერვისში, Chrome ბრაუზერში და სხვა სერვისებში.

დეველოპერები და საწარმოს მომხმარებლები შეძლებენ Pro-ზე წვდომას Gemini API-ით Google AI Studio-სა და Google Cloud Vertex AI-ში 13 წლის 2023 დეკემბრიდან. დეველოპერები Android ექნება წვდომა Nano ვერსიის მოდელზე AICore-ის საშუალებით, რომელიც ხელმისაწვდომი იქნება ადრეული გადახედვისას.

ასევე წაიკითხეთ: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: ორი იოკოძუნის ბრძოლა

ტყუპები Google Bard-ში: რა შეიცვლება?

პრეზენტაციის დროს მოწოდებული ინფორმაციის თანახმად, მოდელი Google Bard-ს საშუალებას მისცემს უკეთ გაუმკლავდეს უფრო რთულ პრობლემებს, როგორც ნათქვამია:

„ჩვენ შევქმენით Gemini ისე, რომ მოდელი ბუნებრივად იყოს მრავალმოდალური და თავიდანვე წინასწარ მომზადებული მრავალ მოდალობაზე. ჩვენ შემდეგ დახვეწეთ ის მეტი მულტიმოდალური მონაცემების დამატებით შესრულების გასაუმჯობესებლად. შედეგად, ტყუპები ადვილად ესმით და გამოიტანს დასკვნებს ბევრად უკეთ, ვიდრე წინა მულტიმოდალური მოდელები და ამაყობს უახლესი შესაძლებლობებით თითქმის ყველა სფეროში.

ტყუპების არაჩვეულებრივი მულტიმოდალური შესაძლებლობები გეხმარებათ რთული ტექსტური და ვიზუალური ინფორმაციის გაგებაში. ისინი განსაკუთრებით სასარგებლოა, როდესაც საქმე ეხება მონაცემთა უზარმაზარი ნაკრებიდან კონკრეტული ინფორმაციის მოპოვებას. ამ მოდელის არაჩვეულებრივი უნარი ამოიღოს ინფორმაციის არსი ასიათასობით დოკუმენტიდან მათი წაკითხვით, გაფილტვრით და ანალიზით, უდავოდ ხელს შეუწყობს ახალ, ელვისებურად სწრაფ აღმოჩენებს სხვადასხვა სფეროში, მეცნიერებიდან ფინანსებამდე.

პრეზენტაციის დროს აჩვენეს კომპლექსური კვლევის მაგალითი, რომელიც შეიცავს 200 ათასზე მეტ ჩანაწერს, რომელთაგან ზოგიერთი განახლება ახალი მონაცემების მიხედვით უნდა მომხდარიყო. როგორც თქვენ ალბათ მიხვდით, ამის ხელით გაკეთება ძალიან შრომატევადი იქნებოდა, ამიტომ კვლევის ავტორებმა გამოიყენეს Gemini კოდის მოსამზადებლად, რომელიც იღებდა შენატანს და აკეთებდა საჭირო განახლებებს. კიდევ ერთი, უფრო რეალური მაგალითია Google-ის ენის მოდელის გამოყენება მათემატიკური ან ფიზიკის პრობლემების ასახსნელად.

აქ შეყვანილი მონაცემები იყო სკოლის გაკვეთილიდან მიღებული დავალების ფოტო/სკანირება. სისტემამ შეძლო იქ შენახული გრაფიკისა და ტექსტის დამუშავება და შემდეგ მიუთითა საშინაო დავალების რომელი ნაწილები იყო სწორად შესრულებული და რომელს მეტი ყურადღება სჭირდებოდა. პრეზენტაციამ აჩვენა, რომ მომხმარებელს შეუძლია არაერთხელ სთხოვოს ტყუპებს დავალების ახსნა და ყოველი შემდგომი მცდელობა უფრო მარტივი ენით უნდა იყოს ახსნილი. რამდენად ზუსტი და სწორი იქნება ტყუპები, რა თქმა უნდა, დაინტერესებულები შეამოწმებენ, მაგრამ ტექსტის წაკითხვისა და უშუალოდ ფოტოებიდან დამუშავების უნარი შთამბეჭდავია. როგორც დამატებულია პრეზენტაციის დროს:

"ტყუპებს ასწავლეს ტექსტის, სურათების, ბგერების და სხვათა ამოცნობა და გაგება ერთდროულად. ამის წყალობით, ის უკეთ ესმის ინფორმაციის ნიუანსებს და შეუძლია უპასუხოს რთულ კითხვებს. ის განსაკუთრებით ეფექტურია მათემატიკასთან და ფიზიკასთან დაკავშირებული თემების ასახსნელად, ასე რომ, ის შეიძლება იყოს პირადი საშინაო დავალების დამხმარე.".

ტყუპები Google Pixel სმარტფონებში

Google-მა ასევე დაიკვეხნა, რომ Gemini „სწავლობდა“ ახალ TPUv5 ჩიპსეტებზე და გეგმავს Gemini Ultra-ს წარდგენას 2024 წლის დასაწყისში, რომელიც გამოიყენებს Bard Advanced-ს, გიგანტის მეტყველების მოდელის სამომხმარებლო ვერსიის ახალ ვერსიას. Gemini Ultra ამჟამად ტესტირების პროცესშია და უკვე ხელმისაწვდომია უსაფრთხოების ექსპერტების შერჩევისთვის.

ბოლო მნიშვნელოვანი ინფორმაცია არის Gemini-ის დანერგვა Google Pixel 8 სმარტფონებში. ეს საშუალებას მისცემს, სხვა საკითხებთან ერთად, შექმნას სწრაფი პასუხები მესინჯერებში Gboard აპლიკაციის მეშვეობით. პირველი არის WhatsApp, მაგრამ მომავალ წელს ასეთი გადაწყვეტილებები გამოჩნდება კომუნიკაციასთან დაკავშირებულ სხვა აპლიკაციებში. თუმცა, ეს მხოლოდ დასაწყისია, რადგან Google-მა გამოაცხადა მრავალი ახალი AI ინსტრუმენტი Pixel 8 სმარტფონებისთვის და ისინი მომავალში ხელმისაწვდომი იქნება ზოგიერთ სხვა მოწყობილობაზე. Android. თუმცა, ეს არის შემდგომი გეგმები და ამ დროისთვის დეტალები არ არის მოწოდებული.

რით განსხვავდება Gemini სხვა AI მოდელებისგან, როგორიცაა GPT-4?

Google-ის ახალი Gemini მოდელი, როგორც ჩანს, ერთ-ერთი ყველაზე დიდი და მოწინავე AI მოდელია დღემდე, თუმცა Ultra მოდელის გამოშვება ამას ნამდვილად განსაზღვრავს. სხვა პოპულარულ მოდელებთან შედარებით, რომლებიც ამჟამად იყენებენ AI ჩეთბოტებს, Gemini გამოირჩევა საკუთარი მულტიმოდალური ფუნქციით, ხოლო სხვა მოდელები, როგორიცაა GPT-4, ეყრდნობა დანამატებს და ინტეგრაციას, რათა იყოს ჭეშმარიტად მულტიმოდალური.

შეშფოთება სიზუსტისა და მიუკერძოებლობის შესახებ

მიუხედავად იმისა, რომ Gemini არის მნიშვნელოვანი წინსვლა ხელოვნური ინტელექტის შესაძლებლობების განვითარებაში, მას აქვს იგივე ნაკლოვანებები, როგორც სხვა ძირითად ენობრივ მოდელებს. პირველ რიგში, ეს არის ყალბი ინფორმაციის შექმნის შესაძლებლობა. მიკერძოება ასევე ეფუძნება ტრენინგის მონაცემებს, რომლებიც ხელმისაწვდომია ახალი ენის მოდელისთვის. ასევე აღსანიშნავია რეალური სამყაროს შეზღუდული გაგება. Google აღიარებს, რომ ტყუპების ახალ მოდელს შეუძლია შეცდომები დაუშვას, მოგვაწოდოს ფაქტები, რომლებიც არ არის დაფუძნებული მტკიცებულებებზე და ეწინააღმდეგება საღ აზრს.

საჭიროა მეტი ტესტები, განსაკუთრებით Gemini Ultra-სთვის, რომელსაც აქვს ახალი შესაძლებლობები, რომლებიც ჯერ ბოლომდე არ არის შესწავლილი. Google მზად არის გულდასმით შეაფასოს ტყუპები, რათა მინიმუმამდე დაიყვანოს პოტენციური ზიანი.

ასევე საინტერესოა: ყველაფერი Microsoft კოპილოტი: მომავალი თუ არასწორი გზა?

მომავალი ტყუპებთანაა

Google-ის მიერ Gemini-ის გაშვებამ AI განვითარების ახალი ერა დაიწყო. წინა მოდელებთან და ადამიანის საბაზისო ხაზებთან შედარებით თავისი საუკეთესო შესრულებით, Gemini მიუთითებს ხელოვნური ინტელექტის სამომავლო შესაძლებლობებზე, მაგრამ მაინც სჭირდება მეტი კვლევა გარკვეული ხარვეზების გამოსასწორებლად.

სამომავლოდ, შეგიძლიათ ველოდოთ Gemini-ს Google-ის პროდუქტებში უფრო სასარგებლო და ინტელექტუალურ ფუნქციებს. მომავალში, კომპანია გეგმავს გააგრძელოს Gemini-ის გაფართოება ინგლისური ენის მიღმა და დაეყრდნოს მისი ძირითადი მოდელის მეთოდოლოგიას.

ჩვენ შეგვიძლია მხოლოდ ვუყუროთ და ვიმედოვნებთ, რომ Google-მა იცის რას აკეთებს.

ასევე წაიკითხეთ:

Yuri Svitlyk

კარპატების მთების შვილი, მათემატიკის ამოუცნობი გენიოსი, "იურისტი"Microsoft, პრაქტიკული ალტრუისტი, მემარცხენე-მარჯვენა

შემდეგი სტატია Acer გამოაცხადა Predator Extreme ელექტრო სკუტერი, ახალი სათამაშო მონიტორები და ლეპტოპები »

წინა სტატია « Homeworld 3-ის გამოშვება გადაიდო 2024 წლის მაისისთვის

დატოვე პასუხი

Tags: GoogleშერჩეულიᲮელოვნური ინტელექტი