Arama motorlarına erişim hızı gün geçtikçe artmaya devam ediyor. Ancak, bir AI sohbet robotu kullanıldığında, elde edilen cevapların tamamının doğru olmadığını bilmek önemlidir. GPT-3.5 gibi büyük dil modelleri, Eylül 2021’e kadar internet üzerinde bulunan metinlerle eğitildi. Google ve Microsoft gibi büyük şirketler, dil modellerini arama motorlarıyla genişletmek için mevcut web içeriğine erişim sağlamaya çalışıyor. Bu şekilde, siz bir soru sorduğunuzda verileri topluyor, ancak doğruluğunu kontrol edemiyor.
Yapay zeka araçları üzerine yapılan araştırmalar, arama motorlarının anahtar kelime tabanlı erişim sistemleri olduğunu belirtiyor. Buna ek olarak çoğu soruya her zaman doğrudan yanıt vermediğini kanıtladıklarını da dile getiriyor. Ayrıca, farklı web sayfaları ilgisiz, çelişkili veya yanlış bilgiler içerebiliyor. Bu nedenle, cevaplara hemen güvenmemek önemlidir.
Bunun yanı sıra, Bard ve Bing gibi platformlarda kullanılacaksa, geliştiricilerin dil modellerinin gürültülü ve tutarsız bir metin topluluğundan en yararlı bilgileri çıkarmasını sağlamaları gerekiyor. Uzmanlar, web araması için yanıtların daha iyi oluşturulabilmesi için modellerin daha ince ayarlanması gerektiğini savunuyor.
Çalışan uzman ekipler, Meta’nın LLaMA adını verdiği yedi milyar parametreli bir dil modelini kullanarak ince ayarlamalar yapıyor. Bu model, 52 bin çift metin tabanlı talimat ve GPT-4 tarafından oluşturulan karşılık gelen cevapları içeren bir veri tabanında eğitildi. Araştırmacılar, her talimatla ilişkili en iyi beş web sayfasını içeren ayrı bir veri seti oluşturarak doğru yanıtı oluşturmak için eğitim verdiler. Ayrıca, ince ayarlı modelin dikkat dağıtıcı veya güvenilmez arama sonuçlarını göz ardı etme konusunda daha başarılı olduğu ve daha yüksek kaliteli yanıtlar ürettiği belirtiliyor.
Konuyla ilgili olarak uzmanlar, “Yaptığımız eğitim, her arama sonucunun faydalı olup olmadığını belirlemek için bir adım içeriyor. Dil modeli, seçilen faydalı bilgileri takip etmeyi başarıyor. Bu süreç, en güvenilmez ve ilgisiz arama sonuçlarını filtreleyerek, ortalama talimat izleme performansını artırıyor.” diyor.
Sonuç olarak, arama motorlarına erişim hızı artarken, AI sohbet robotları aracılığıyla elde edilen cevapların tamamının doğru olmadığını bilmek önemlidir. Büyük dil modelleri, mevcut web içeriğiyle eğitildiği için, arama motorlarıyla genişletilmeye çalışılıyor. Ancak bu sistemlerin, anahtar kelime tabanlı çalıştığı ve her soruya doğrudan yanıt vermediği gözlemleniyor. Ayrıca, web sayfalarının içerdiği bilgilerin ilgisiz, çelişkili veya yanıltıcı olabileceğinin de unutulmaması gerekiyor.