x

Yeni Siri’nin daha iyi konuşabilmesinin sırrı

Yeni Siri’nin daha iyi konuşabilmesinin sırrı

Yeni Siri, artık kelimeleri daha düzgün telaffuz edecek.

6 yıldır hayatımızda olan Siri, iOS 11 ile birlikte artık çok daha doğal ve akıcı şekilde konuşacak. Hatta o kadar doğal olacak ki, kimse bir farklılık olduğunu bile fark etmeyecek. Hani o hiç duymadığı bir ismi ya da bir yerin adını söylemeye çalıştığı zamanki çektiği, ve açıkçası bize çektirdiği, acı artık olmayacak.

Bu yanlış telaffuzların sebebi aslında Siri’nin ilk yapım aşamasındaki kullanılan tekniklerden kaynaklanıyor. Siri’nin ses algılama ve cevap verme sistemini yazan Nuance, Susan Bennett’e (Siri’nin ilk sesi) tüm ses kombinasyonlarını alabilmek için yüzlerce farklı cümle okuttu ve bunları kaydetti.

Kaydedilen cümleler anlamlı cümleler değildi elbette. Daha ziyade İngilizce için “Say the shrading again, say the shraeding again.” ya da “Fasa, ask fasa ask sati” gibi cümleler kaydedildi.

Bu farklı kayıtların arasından Siri, gelen milyonlarca soruya cevap verebilmek için, ihtiyacı olan ses kalıplarını kullandı. Elbette bunun sonucunda bazı kelimeleri “gerçek bir insan gibi” telaffuz etmekte zorlandı.

Değişim vakti geldi

Geçtiğimiz yıl Siri, sessiz sedasız bir yenilenmeye gitti. Apple, Siri’nin konuşma tanıma ve soruyu algılama özelliklerinde makine öğrenmesi kullanmaya karar verdi. Yapılan geliştirmelerin sonucunda da başarı elde edildi.

Buradan gelen başarı ile makine öğrenmesi bu sefer Siri’nin konuşması için kullanılacak. iOS 11 ile gelecek olan Siri, yepyeni bir Siri olacak.

Apple, tam olarak detay vermese de Siri’nin herhangi bir şeyi söyleyebileceğini aktarıyor. Zira Siri’nin başarılı cümleler kurabilmesini sağlayacak teknoloji ile bizi anlaması için kullanılan teknoloji aynı.

Apple makine öğrenmesini, ya da daha derine inersek deep learning (derin öğrenme) ve neural networks (nöral ağlar) denen makine öğrenmesinin alt kırılımını kullanıyor. Bu teknolojiler beynin çalışma prensiplerini taklit ediyorlar.

Cevapların daha doğal duyulması adına Apple, Siri’ye birçok insan konuşması dinletti. Makine öğrenmesi sistemi bu konuşmalardan insanların konuşurken nasıl ve nerelerde nefes aldığını, tonlamalarını, vurgularını ve cümle içerisindeki seslerinin nasıl değiştiğini inceledi.

Aynı zamanda bu algoritma, yapay zeka ve makine öğrenmesinin gücünü arkasına alarak anlamsal incelemeler de yapıyor. Aynı cümlede, aynı kelimeleri, cümlenin farklı yerlerinde söylerken neden farklı telaffuz ettiğimizi de öğreniyor.

Apple Siri’nin konuşmasını daha akıcı daha insansı yapmaya niyetli. Bu sayede Siri’nin nasıl konuştuğuna değil, bize ne söylediğine daha fazla odaklanabileceğiz. Hele ki yeni gelecek olan Siri’nin konuşmanın gidişatını takip edebileceğini ve konuyu takip eden soruları anlayacağını göz önünde bulundurursak Siri’nin şimdiye kadar olduğundan daha akıcı olması gerekiyor.

Elbette bu bahsi geçenler İngilizce konuşan Siri adına gelen bilgiler. Siri dünyada 21 dil konuştuğunu ve yeni 5 dil daha eklenecek. Bakalım bu teknoloji tüm dilleri mi kapsayacak yoksa sadece İngilizce özelinde mi olacak hep birlikte ilerleyen aylarda göreceğiz.

Yorumlar (0)