SesHavuzu – Dil Modeli Tabanlı Sentetik Senaryolar ile Türkçe Konuşma Verisi Toplanması
Sorumlu Araştırmacı: Erdi YALÇIN, Öğr. Gör.
Kurum/Program: Düzce Üniversitesi / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği ABD
İletişim: erdiyalcin@duzce.edu.tr
Bu çalışmanın amacı, Türkçe konuşma teknolojilerinin (ör. otomatik konuşma tanıma) geliştirilmesine katkı sağlamak üzere, büyük dil modelleri ile üretilmiş sentetik senaryoların seslendirilmesiyle konuşma verisi toplamaktır. Metinler sentetik olarak üretildiğinden, gerçek kişilere ait özel veya hassas içerik kullanılmamaktadır.
Katılımınız kapsamında:
Katılım süresi, tamamen sizin tercihlerinize bağlıdır; istediğiniz kadar kayıt yapabilir veya doğrulama gerçekleştirebilirsiniz.
Katılım gönüllüdür. İstediğiniz anda herhangi bir gerekçe göstermeden çalışmadan çekilebilirsiniz. Çekilmeniz herhangi bir hak kaybına veya yaptırıma yol açmaz.
Not: Verilerin bir kısmı daha sonra açık kaynaklı paylaşılabileceğinden, veriseti kamuya açıldıktan sonra daha önce paylaşılmış anonim kayıtların geri çekilmesi teknik olarak her zaman mümkün olmayabilir. Ancak talebiniz halinde, paylaşım gerçekleşmeden önce araştırma ekibi imkânlar ölçüsünde verilerinizin çalışmadan çıkarılmasını değerlendirir.
Tüm veriler, yetkisiz erişime karşı korunacak şekilde güvenli sunucularda saklanır; verilere yalnızca araştırma ekibinde yetkilendirilmiş kişiler erişebilir.
Bu çalışma düşük risklidir. Olası rahatsızlıklar; seslendirme sırasında yorgunluk veya zaman ayırma gerekliliği ile sınırlı olabilir. Metinler sentetik üretildiği için özel/hassas içerik taşıma riski azaltılmıştır.
Bu çalışmadan size doğrudan bir fayda garantisi verilmemektedir. Ancak çalışma, Türkçe konuşma teknolojilerinin geliştirilmesine ve daha geniş bir araştırma altyapısına katkı sağlayabilir.
Araştırma sonucunda oluşacak verisetinin, araştırma ekibi tarafından belirlenecek zaman ve kapsam çerçevesinde açık kaynaklı bir web sitesi üzerinden paylaşılması planlanmaktadır. Paylaşılacak veriler, herhangi bir gerçek kişiyle ilişkilendirilemeyecek şekilde anonimleştirilmiş olacaktır.
Verisetinin kullanımının eğitim/araştırma ile sınırlandırılması hedeflenmemektedir; açık kaynak koşulları çerçevesinde ticari kullanım dâhil farklı kullanım senaryolarına açık olabilir.
Çalışma hakkında sorularınız için:
Araştırmacı: Erdi YALÇIN – E-posta: erdiyalcin@duzce.edu.tr
Aşağıdaki maddeleri okuduğumu ve anladığımı beyan ederim:
Onay veriyorum ve çalışmaya katılmayı kabul ediyorum.