Cleanlab, yapay zeka, büyük dil modelleri ve analitik çözümler için kullanılan kurumsal verilerin değerini ve doğruluğunu otomatik olarak artıran bir otomatik veri kürasyon çözümü geliştirdi. Şirket, Seri A finansman turunda 25 milyon dolar topladı ve bu tur, Menlo Ventures ve TQ Ventures tarafından yönetildi. Cleanlab, işletmelerin veri odaklı analitik kararlar ve generatif AI çözümleri üzerinden karlılığını artırmayı hedefliyor. Kötü verilerin ABD’ye maliyetinin 3 trilyon dolardan fazla olduğu ve işletmelerin zamanlarının %80’ini veri kalitesini manuel olarak iyileştirmekle geçirdiği belirtiliyor. Cleanlab, verilere otomatik olarak akıllı meta veriler ekleyerek, karmaşık gerçek dünya verilerini çeşitli modeller için kullanışlı girdilere dönüştürüyor. Bu süreç, kurumsal analitik, LLM ve AI kararlarının güvenilirliğini ve kar marjını artırıyor.
Cleanlab’ın yenilikçi AI algoritmaları, MIT’den doktora derecelerine sahip kurucular tarafından geliştirildi. Şirketin özgün veri kürasyon yaklaşımı, “güvenilir öğrenme” alanında yapılan çalışmalara dayanıyor. Cleanlab, AWS, JPMorgan Chase, Google, Oracle ve Walmart gibi Fortune 500 şirketlerinin %10’dan fazlası ve ByteDance, HuggingFace ve Databricks gibi yenilikçi girişimler tarafından kullanılıyor. Şirket, büyük görsel, metin ve tablo veri setlerindeki sorunları bulup düzeltiyor. Cleanlab Studio, güvenilir dil modelleri (TLM) üreterek, ChatGPT, Falcon gibi LLM çıktılarına güvenilirlik puanı ekliyor ve veri setlerindeki sorunları tespit edip düzeltiyor.
Cleanlab’ın kurucu ortağı ve CEO’su Curtis Northcutt, Microsoft ve Tesla gibi şirketlerle AI odaklı ürünlerin daha iyi işlemesine yardımcı olduklarını ve MIT ile Harvard’da hile tespitinde bulunduklarını belirtiyor. Cleanlab Studio, AI ve analitiklerin insanlar ve işletmeler için ne yapabileceğini yeniden hayal etmeye imkan tanıyor. Menlo Ventures’tan Matt Murphy, Cleanlab’ın AI modellerini daha iyi ve temiz verilerle temelde iyileştiren bir veri kürasyon platformu geliştirdiğini söylüyor. TQ Ventures’tan Schuster Tanger, Cleanlab’ın belirsiz ve yanlış etiketlenmiş verilerle ilgili büyük ve acil bir soruna çözüm sunduğunu belirtiyor. Google’dan Patrick Violette, Cleanlab’ın veri hatalarını doğru bir şekilde bulduğunu ve Google’da başarılı bir projede kullanıldığını ifade ediyor.