Kayıpları yapay zeka arayacak
Toplum/Yaşam Haberleri —
- Şili Devlet Başkanı Gabriel Boric, Pinochet diktatörlüğü döneminde kaybedilen 1000'den fazla insan için Arama Planını başlattı. Bugün, birçoğu daktilo ile yazılmış eski adli belgeler, en son teknoloji ve çapraz referans verilerini uygulamak üzere dijitalleştirilmiş durumda.
15 Ocak Pazartesi günü Santiago'da düzenlenen "Geleceğin Kongresi"nin açılışında Başkan Gabriel Boric, yapay zekanın "kayıp tutuklularımızın aranmasında önemli bir rol oynayacağını" belirtti. Boric, Augusto Pinochet diktatörlüğünün kurbanı olan 1000'den fazla kişiyi bulmayı amaçlayan ve 30 Ağustos 2023'te, sosyalist başkan Salvador Allende'yi deviren darbenin 50. yıldönümünün 11 Eylül'deki anma töreni arifesinde Yönetiminin sunduğu Arama Planına atıfta bulunuyordu.
El Pais’ten Ana Maria Sanhueza’nın haberine göre Adalet Bakanı Luis Cordero'nun öncülük ettiği plan, kalıcı bir devlet politikası haline gelmesi amaçlanan bir girişim.
1469 kayıp
Adalet Bakanlığı verilerine göre Şili'de diktatörlükten sonra 1469 zorla kaybetme mağduru var ve bunların 1092'sini kayıp tutuklular oluşturuyor. Ayrıca, idam edilen 377 kişi de kayıp. Şu ana kadar sadece 307'sinin kimliği tespit edilebilmiş.
Adalet Bakanı Cordero EL Pais’e yaptığı açıklamada, mahkemeler tarafından halihazırda başlatılmış olan bu yeni araştırmaya başlamak için iki ana kaynakla çalıştığını söyledi. Bir yanda milyonlarca sayfadan oluşan adli soruşturmalar. Diğer yanda devlet kurumlarına dağılmış olan davaların idari kayıtları. Bunlar arasında 1997'de kurulan ve Adalet Bakanlığı'na bağlı olan İnsan Hakları Programı'nın yanı sıra (davaları kapatan) askeri savcılıklardaki önceki soruşturmalar ve eski başkan Patricio Aylwin arafından yürütülen ve mağdurların ilk kez anlatıldığı 1991 tarihli Ulusal Hakikat ve Uzlaşma Komisyonu Raporu'na temel teşkil eden dosyalar yer alıyor.
Rafa kaldırılmış davalar
Bilgilerin teknolojik analizinin arkasında, genel müdürü Antonio Díaz-Araujo olan veri analizi, veri bilimi ve yazılım geliştirme konularında uzmanlaşmış bir şirket olan Unsholster bulunuyor. İnsan Hakları Programı ile Adli Şube bilgileri yüzde 80 oranında dijitalleştirilmiş durumda. Firma projeyi Arama Planı bağlamında bir ihale sürecinde kazandı ve yapay zekanın uygulanmasından sorumlu.
Bu soruşturmada önemli olan bir husus, her bir davaya göre ayrılmış olan adli dosyaların eski Şili adalet sisteminde işlenmiş olması, bu da hakimlerin soruşturmalarının kağıt üzerinde olduğu anlamına geliyor.
Ancak bunlara ek olarak, 2000 yılından bu yana yürütülen adli soruşturmalar, analizde daha güncel ve önemli bir bilgi temeli sağlayacak. O tarihten bu yana, diktatörlük döneminde rafa kaldırılmış olan yüzlerce dava, insan hakları ihlallerine ilişkin davalara özel olarak bakan hakimler tarafından yeniden açılmış ve cezalar verilmiş.
Yapay zekâ ne yapacak?
Cordero, "Devletin elinde çok fazla bilgi var ve bunları işleyecek insan kapasitesi yok, çünkü bunların birbirine bağlanması gerekiyor. Örneğin, bazı dosyalarda yer alıp diğerlerinde yer almayan ifadeler var. Ayrıca, hakimlere bağlı olarak, soruşturma hatları vardı, bu nedenle bazıları için yararlı olan, diğerleri için yararlı olmayan emsaller olabilirdi.
Tüm bu bilgiler adli ve idari dosyalarda yer alıyor ve dijitalleşme ilk olarak bunları tek bir yerde birleştirmeyi başarıyor. Daha sonra da, test edilmekte olan ve örneğin bu dosyalardaki tarihleri, isimleri, yerleri okuyabilen algoritmaları kullanarak soruşturma boşluklarını azaltmamızı sağlayan yapay zeka ile çalışmaktır" diyor.
Bu nedenle Adalet Bakanı yapay zekânın kilit bir rol oynayabileceğini, zira bu tür davalarda bilgilerin çapraz referanslanmasının çok önemli olacağına inandığını söylüyor.
4,7 milyon sayfa belge
Díaz-Araujo, Unsholster'ın şu anda programlamaya başlamadan önceki ön proje aşamasında olduğunu belirtiyor: "Ancak ilgilenmemiz gereken dosya türlerinin çoğuna şimdiden değindik.” Gelen ve sayfa sayfa taranan belgeler klasörlerde, PDF formatında ve bu nedenle görüntü olarak kaydedildikleri için verilerin aranmasına izin veren bir mantığa karşılık gelmiyor. Bu nedenle ilk adım, veriye dönüştürülebilmeleri için OCR (Optik Karakter Tanıma) teknolojisini uygulamaya başlamak olmuş.
Hâlihazırda ellerinde - henüz Adli Şube'nin binlerce dosyasını içermeyen - toplam 46.768 PDF dosyası ve bu 4,7 milyondan fazla sayfaya denk geliyor. Díaz-Araujo, "Eğer bir kişi bu sayfaların her birini yüksek sesle ve anlamadan ya da gerçeklerle ilişkilendirmeden okuyacak olsaydı, muhtemelen 27 yıl boyunca günde sekiz saatini okuyarak geçirirdi" diyor.
Díaz-Araujo, bu dosyalar sayfalara taşındıktan sonra, "resim, el yazması, daktilo ile yazılmış sayfalar veya Word tarzı dosyalar içeren sayfaları sınıflandırmanıza olanak tanıyan büyük bir sınıflandırma ağacı oluşturuluyor” diyor, ve anahtarın "her birine hangi materyalin getirildiği" olduğunu ekliyor.
Bir diğer aşamanın ise "kullanımla öğrenilebilecek" farklı türde sözlükler ve varlıklar oluşturmak olduğunu belirtiyor. Örneğin, insanların, yerlerin, sokakların eski adları (diktatörlükten bu yana birçoğunun adı değişti), yazma biçimleri ve tarihler.
Belgeler nasıl sınıflandırılıyor?
Bu, her bir metnin okunmasında, teknolojiyi kullanarak, "farklı sayfaları, insanları, yerleri ve tarihleri son derece esnek bir şekilde hızla ilişkilendirebilen" bir varlık topolojisi oluşturmak anlamına geldiğini söylüyor. Bir örnek veriyor: "Suçluların birçoğunun takma adı olabilir ve birçoğu farklı şekillerde yazılmış olabilir, ancak bu bağlantılı olmayacakları anlamına gelmez. Yaptığınız şey, zaman içinde ortaya çıktıkça analiste başka korelasyonlar önerebilecek bir teknoloji yaratmak."
Bu nedenle, "belgelerin sınıflandırılmasında yapay zeka devreye giriyor; görüntü formatındaki belgelerin aranabilir verilere dönüştürülmesinde yine yapay zeka devreye giriyor. Ve son olarak, bir platformda en gerekli olan şey, bu veriler üzerinde yapay zeka ile veya yapay zeka olmadan algoritmaları yarıştırma olasılığı ile ilgili olması. Ama tek bir teknolojiye bağlı kalmaması lazım çünkü en büyük mesele geleceğin yeni teknolojilerine açık olmak. Eğer bunu tek bir teknoloji ile işlenebilecek şekilde yaparsanız, bu bir engele dönüşür."
İşkenceciler açığa çıkıyor
Teknolojinin Unsholster'ın İnsan Hakları Programının yaklaşık 47.000 belgesine ilk kez uygulanmasından beş ay sonra, kimlik belgeleri üzerinde ilk OCR uygulaması sayesinde, Pinochet'nin gizli polisinin bir parçası olan en az dört askeri görevliden binlerce kez bahsedildiğini bulmak mümkün oldu.
Yüzlerce suçtan dolayı 2015 yılında 526 yıl hapis cezasına çarptırılan genel müdür Manuel Contreras'ın adı 2800 kez geçiyor; Punta Peuco hapishanesinde cezalarını çeken Pedro Espinoza ve Miguel Krassnoff'un adları ise sırasıyla 2079 ve 2954 kez geçiyor. Eski sosyalist başkan Michelle Bachelet'in annesi Ángela Jeria'nın işkencecisi Marcelo Moren Brito'dan ise 2284 kez bahsediliyor.
Şimdilik bunlardan sadece bahsediliyor. “Ancak bundan sonra isimler, gerçekler, tarihler ve yerler birbirleriyle ilişkilendirilebilecek” diyor Díaz-Araujo. HABER MERKEZİ