Canlı sohbete katılmak, haber, uzman görüşü ve piyasa sinyallerini anında almak için TELEGRAM, TWITTER, FACEBOOK, INSTAGRAM’dan bizi takip edin.
Harvard Üniversitesi, Google iş birliğiyle yapay zeka (AI) eğitiminde kullanılmak üzere 1 milyon kamu malı (public domain) kitaptan oluşan bir veri seti yayımladı. Charles Dickens, Dante, ve Shakespeare gibi ünlü yazarların eserlerini içeren bu kitaplar, yaşları nedeniyle artık telif hakkı koruması altında değil.
Bu adım, AI modellerini eğitmek için gereken büyük miktardaki verinin genellikle yüksek maliyetli olmasına bir çözüm sunmayı hedefliyor ve daha geniş bir araştırmacı kitlesine fayda sağlamayı amaçlıyor.
Harvard ve Teknoloji Devlerinin İş Birliği
Proje, Harvard Üniversitesi’nin Kurumsal Veri Girişimi (Institutional Data Initiative – IDI) tarafından yürütülüyor. Bu girişim, kitapları Google’ın uzun süredir devam eden kitap tarama projesi Google Books’tan alıyor.
Projeye Microsoft ve OpenAI gibi teknoloji devleri de mali destek sağladı. Bununla birlikte, IDI, veri setini yalnızca Silikon Vadisi’ne değil, araştırma laboratuvarlarından küçük AI girişimlerine kadar herkese açık hale getirdi.
IDI’nin icra direktörü Greg Leppert, bu veri setinin “oyun alanını eşitlemek” için önemli bir adım olduğunu belirtti. Yapay zeka eğitimindeki yüksek maliyetlerin küçük şirketler için erişimi zorlaştırdığı bir dönemde, bu girişim daha fazla araştırmacının ve şirketin veri setine erişebilmesini mümkün kılıyor.
Açık Veri Seti: Avantajlar ve Zorluklar
Leppert, projeyi Linux’a benzeterek, bu açık kaynak veri setinin başarısının daha fazla kaynak, uzmanlık ve yaratıcı çözümler gerektirdiğini belirtti. Google Books’un bir parçası olarak taranan bu kitaplar, yapay zekanın geliştirilmesi için dijital bir zaman kapsülü olarak tanımlanıyor.
Bununla birlikte, projenin başarıya ulaşabilmesi için daha fazla desteğe ihtiyaç duyulacağı belirtiliyor. Veri seti, küçük çaplı girişimlerden büyük şirketlere kadar farklı oyunculara yapay zeka modellerini geliştirme fırsatı sunarken, rekabet ortamını da kızıştırabilir.
AI ve Veri Kullanımı Üzerine Etik Tartışmalar
Açık veri girişimi birçok kişi tarafından yapay zekanın demokratikleşmesi yönünde bir adım olarak görülse de, eleştiriler de mevcut. Bazı yorumcular, bu adımın daha fazla oyuncunun AI geliştirme yarışına katılmasını teşvik ettiğini ancak piyasada gerçek bir etki yaratmanın daha fazla kaynak gerektireceğini savunuyor.
Ayrıca, AI modelleri için artan veri ihtiyacı, etik sorunları da beraberinde getiriyor. Örneğin, Wall Street Journal ve New York Times gibi yayıncılar, verilerinin izin alınmadan kullanıldığı gerekçesiyle OpenAI ve diğer firmalara dava açtı.
Gelecek Vaat Eden Bir Proje
Harvard ve Google’ın iş birliğiyle yayımlanan bu açık veri seti, yapay zekanın gelişimi için önemli bir kaynak olma potansiyeline sahip. Girişim, hem küçük girişimlerin hem de büyük şirketlerin AI geliştirme yarışında daha eşit şartlarda rekabet etmesini sağlarken, veri kullanımı ve etik üzerine devam eden tartışmaları da yeniden gündeme taşıyor.