Škoda Karoq
კატეგორიები: IT სიახლეები

AI კომპანიები აგროვებენ მონაცემებს მასმედიის საიტებიდან პირდაპირი აკრძალვების საწინააღმდეგოდ

Perplexity, რომელიც თავის პროდუქტს აღწერს, როგორც „უფასო საძიებო სისტემას ხელოვნური ინტელექტით“, ბოლო დღეებში კრიტიკის ქვეშ მოექცა. მალევე მას შემდეგ, რაც Forbes-მა დაადანაშაულა იგი მისი სტატიის მოპარვასა და მრავალ პლატფორმაზე ხელახლა გამოქვეყნებაში, Wired-მა განაცხადა, რომ Perplexity უგულებელყოფდა Robot Exclusion Protocol-ს ან robots.txt-ს და აშორებდა მის სტატიებს თავისი საიტიდან და სხვა Condé Nast-ის პუბლიკაციებიდან. ტექნიკური საიტი The Shortcut ასევე დაადანაშაულა ხელოვნური ინტელექტის კომპანია მისი სტატიების წაშლაში. ახლა Reuters-მა გამოავლინა, რომ Perplexity არ არის ერთადერთი ხელოვნური ინტელექტის კომპანია, რომელიც გვერდს უვლის robots.txt ფაილებს და აგროვებს ვებსაიტებს იმ შინაარსისთვის, რომელსაც შემდეგ იყენებს თავისი ტექნოლოგიის მოსამზადებლად.

Reuters იტყობინება, რომ მან ნახა TollBit-ის გამომცემლებისადმი მიმართული წერილი, სტარტაპი, რომელიც აკავშირებს მათ ხელოვნური ინტელექტის ფირმებთან, რათა მათ შეეძლოთ დადონ სალიცენზიო ხელშეკრულებები და აფრთხილებდნენ მათ, რომ ”AI აგენტებმა სხვადასხვა წყაროდან (არა მხოლოდ ერთი კომპანიის) გადაწყვიტეს გვერდის ავლით. robots.txt პროტოკოლი საიტებიდან შინაარსის მისაღებად." robots.txt ფაილი შეიცავს ინსტრუქციებს საძიებო რობოტებისთვის, რომელ გვერდებზე შეუძლიათ და არ შეუძლიათ წვდომა. ვებ დეველოპერები ამ პროტოკოლს 1994 წლიდან იყენებენ, მაგრამ მისი დაცვა სრულიად ნებაყოფლობითია.

TollBit-ის წერილში არცერთი კომპანია არ იყო დასახელებული, მაგრამ Business Insider-მა განაცხადა, რომ გაირკვა, რომ OpenAI და Anthropic - ჩატბოტების შემქმნელები, შესაბამისად, ChatGPT და Claude - ასევე გვერდს უვლიან robots.txt სიგნალებს. ორივე კომპანიამ ადრე თქვა, რომ ისინი პატივს სცემენ "არ დაცოცავ" ინსტრუქციებს, რომლებსაც ვებსაიტები ათავსებენ თავიანთ robots.txt ფაილებში.

გამოძიების დროს Wired-მა აღმოაჩინა, რომ ამაზონის სერვერზე არსებული მანქანა „აუცილებლად მართავდა Perplexity“ გვერდის ავლით მისი ვებსაიტის robots.txt ინსტრუქციებს. იმის დასადასტურებლად, რომ Perplexity ასუფთავებს მის შინაარსს, Wired-მა გამოაქვეყნა კომპანიის ხელსაწყოების სათაურები მისი სტატიებიდან, ან მოკლე რჩევები, რომლებიც აღწერს მათ ისტორიებს. არსებული ინფორმაციით, ხელსაწყო აწარმოებდა შედეგებს, რომლებიც ზუსტად ახდენდა მისი სტატიების პერიფრაზირებას „მინიმალური ატრიბუტით“. და ზოგჯერ სტატიებისთვის არაზუსტ შეჯამებებსაც კი ქმნიდა - Wired-ი ამბობს, რომ ჩეთბოტი ცრუ აცხადებდა, რომ აცნობებდა კონკრეტულ კალიფორნიის პოლიციის ოფიცერს, რომელმაც ჩაიდინა დანაშაული ერთ შემთხვევაში.

Fast Company-თან ინტერვიუში, Perplexity-ის აღმასრულებელმა დირექტორმა არავინდ სრინივასმა გამოცემას განუცხადა, რომ მისი კომპანია „არ უგულებელყოფს რობოტების გამორიცხვის პროტოკოლს და შემდეგ იტყუება მასზე“. თუმცა, ეს არ ნიშნავს, რომ ის არ სარგებლობს ბოტებით, რომლებიც უგულებელყოფენ პროტოკოლს. სრინივასმა განმარტა, რომ კომპანია იყენებს მესამე მხარის საძიებო ბოტებს, გარდა საკუთარი, და რომ Wired-ის მიერ იდენტიფიცირებული ბოტი ერთ-ერთი მათგანი იყო. როდესაც Fast Company-მა ჰკითხა, უთხრა თუ არა Perplexity-მა მცოცავი პროგრამის პროვაიდერს, რომ შეწყვიტოს Wired საიტის სეირნობა, მან თქვა: "ეს რთულია".

სრინივასმა დაიცვა თავისი კომპანიის პრაქტიკა და უთხრა გამოცემას, რომ ბოტების გამორიცხვის პროტოკოლი „არ არის იურიდიული საფუძველი“ და ვარაუდობს, რომ გამომცემლებს და მის მსგავს კომპანიებს შესაძლოა ახალი ტიპის ურთიერთობის დამყარება მოუწიონ. მან ასევე მიანიშნა, რომ Wired-მა განზრახ გამოიყენა მინიშნებები, რათა Perplexity ჩეთბოტი ასე მოქცეულიყო, რათა რეგულარული მომხმარებლები არ მიიღებდნენ იგივე შედეგებს. ინსტრუმენტის მიერ გამომუშავებულ არაზუსტ აღმოჩენებთან დაკავშირებით, სრინივასმა თქვა: „ჩვენ არასდროს გვითქვამს, რომ Perplexity ჩეთბოტი არაზუსტია: „არასდროს გვითქვამს, რომ არასდროს გვქონია ჰალუცინაციები“.

ასევე წაიკითხეთ:

Share
Julia Alexandrova

ყავის კაცი. ფოტოგრაფი. ვწერ მეცნიერებასა და სივრცეზე. ვფიქრობ, ჩვენთვის ჯერ ადრეა უცხოპლანეტელებთან შეხვედრა. მე ვაკვირდები რობოტიკის განვითარებას, ყოველი შემთხვევისთვის...

დატოვე პასუხი

თქვენი ელფოსტის მისამართი გამოქვეყნებული არ იყო. აუცილებელი ველები მონიშნულია*