كيف قام مطور أعمى ببناء مُركِّب كلام بمفرده



لقد واجهنا جميعًا ، بطريقة أو بأخرى ، مستخدمين يعانون من مشاكل في الرؤية. إن المسؤولين عن واجهة المستخدم ، بغض النظر عن الموقع أو تطبيق الهاتف المحمول أو أي برنامج آخر ، يعرفون على الأرجح الحاجة إلى مراعاة احتياجات هؤلاء الأشخاص وبالتالي صنعوا أوضاعًا لزيادة التباين والخطوط الكبيرة وما إلى ذلك.



ولكن ماذا لو كان المستخدم أعمى تمامًا وكل هذه الأوضاع لا تجعل حياته أسهل؟ هذا هو المكان الذي تدخل فيه قارئات الشاشة وأجهزة الصوت إلى الساحة ، والتي لا يمكنهم الاستغناء عنها. وأود أن أخبركم عن أحدهم اليوم.



سميت من RhVoice وقد ورد ذكرها في العديد من المنشورات على Habré. لكن هل تعلم أن الكثيرين يعتبرونه أفضل مركب مجاني للخطاب الروسي (وليس فقط) ، وقد كتبه مطور أعمى تمامًا - أولغا ياكوفليفا؟



اليوم نستعيد العدالة التاريخية ونتعلم قليلاً عن المركب نفسه بشكل عام وأولغا بشكل خاص.



دعونا نفتح جميع البطاقات مرة واحدة : synthesizer github



يتم توزيع كود المركب مجانًا بموجب GPL ، مما يعني أنه يمكن لأي شخص دمجها في منتجهم. متاح على ثلاث منصات: Windows و Linux و Android. تقود Olga التطوير بمفردها وتعمل في Linux. أفضل مُركِّب (مفتوح المصدر) للخطاب الروسي ، يعتبره المستخدمون أنفسهم وهم ليسوا فقط من يعانون من ضعف البصر. في عمله ، يستخدم المركّب التوليف الإحصائي المعامِر واستند إلى تطورات المشاريع القائمة ، مثل HTS، والدراسات العلمية المنشورة. إنها شبكة عصبية عميقة هجينة تعمل مع نموذج ماركوف المخفي. مهمة هذه الشبكات هي حل معلمات غير معروفة بناءً على ما يمكن ملاحظته. يمكن اعتبار أن هذه هي أبسط شبكة بايزي. استندت هيئة تحرير الشام نفسها إلى تطورات مشروع آخر - HTK . ولكن هنا نحن مهتمون أكثر بأنه تم نشر بعض التطورات للاستخدام المجاني ، بما في ذلك وصف الخوارزميات والتقنيات التطبيقية.



يتم وضع آلة النطق نفسها كأداة للعمل اليومي. يمكن استخدامه لأغراض أكثر إبداعًا مثل صوت الكتب ، لكنه لا يزال أفضل عندما يتحدث الناس.



بدأت أولجا مشروعها منذ ما يقرب من 10 سنوات ، عندما بدأت في دراسة Linux ولم تجد مُركبًا مناسبًا لها هناك. تكتب كل الشفرات بنفسها ، باستخدام شاشة برايل خاصة لهذا الغرض. هذا جهاز خاص مصمم لعرض المعلومات النصية في شكل ستة أحرف برايل من النقاط. كما أنها تستخدم JAWS ، وهو قارئ شاشة يتتبع تاريخه إلى DOS وقد تم إنشاؤه أيضًا بمشاركة نشطة من المكفوفين.



الآن بعد أن تم تقديم المقدمة ، دعنا نتعمق قليلاً في عالم آلات النطق.



ما هو مركب الكلام وماذا يشمل؟



تقليديا ، يعتبر أن أي مركب يتكون من جزأين: مكون لغوي ومكون لتوليد إشارة الكلام. يحلل مكون اللغة النص الوارد من قارئ الشاشة. وتتمثل مهمتها في تقسيم النص إلى جمل وجمل إلى عبارات وكلمات ومقاطع. في النهاية ، يتم نسخ جميع الكلمات ويتم إنشاء خريطة للأصوات منه (كما يعلم الجميع ، ليس دائمًا كيف يتم كتابتها أو قولها). يمكن إجراء هذا التحليل بعمق مختلف من الدراسة. RhVoice ، على سبيل المثال ، يفتقر إلى الموارد اللازمة للعمليات المعقدة مثل تحديد دور في جملة أو جزء من الكلام. ولكن على أي حال ، في نهاية التحليل ، نحصل على مجموعة من الأصوات التي يجب أن يجمعها مكون توليد إشارة الكلام باستخدام قاعدة الأصوات المسجلة مسبقًا. سنناقش كل مكون بمزيد من التفصيل لاحقًا.





مظاهرة للعمل مع المزج



قصة أولغا



تعيش أولغا في تشيبوكساري ، وتخرجت من كلية الرياضيات بجامعة تشوفاش الحكومية وتعمل كمبرمجة. مثل كل المكفوفين ، درست في مدارس متخصصة. في البداية ، كان هناك 6 فصول في مدرسة في نيجني نوفغورود ، لأنه في ذلك الوقت في تشيبوكساري لم تكن هناك أماكن يُقبل فيها الأطفال المكفوفون تمامًا. لكن بعد ست سنوات ، تمكنت من العودة إلى مسقط رأسها ، وأكملت أولغا دراستها في تشيبوكساري. في نفس المدرسة ، وقعت أولغا في حب الرياضيات ، مما سمح لها لاحقًا بدخول كلية الرياضيات. في مرحلة ما ، فكرت في دخول IWT ، ولكن هنا لعب عدم اليقين في قدراتها دورًا. نعم ، ومن بين خريجي كلية الرياضيات كان هناك العديد من المكفوفين ، وفي المقابلة التمهيدية ، قال العميد إن المبرمجين لديهم أفضل استعدادًا من تكنولوجيا المعلومات والاتصالات.



تلقت أولجا تجربتها الأولى في العمل مع أجهزة الكمبيوتر ليس في المدرسة ، ولكن في الجامعة ، حيث اشتروا في المكتبة أجهزة كمبيوتر خاصة مجهزة لاستخدام المكفوفين ، مع برنامج JAWS المثبت (قارئ الشاشة الذي يقود تاريخه منذ عام 1989). هناك درست كتاب Windows 95 الشهير لسارة مورلي. على الأرجح ، ستندهش الآن ، لأن ما هو هذا الكتاب المدرسي الشهير ، الذي لم تسمع عنه من قبل؟ الجواب يكمن في اسمه: "ويندوز 95 للمكفوفين وضعاف البصر"... يتمثل الاختلاف الرئيسي بين هذه الكتب المدرسية من تلك المألوفة لنا جميعًا في التركيز على وصف الكائنات والخيارات المختلفة لإدارتها. نظرًا لأنه بالنسبة لشخص كفيف ، فإن تعليمات النموذج "انقر فوق القائمة المنسدلة وحدد عنصر القائمة المطلوب" غير مجدية إلى حد ما. لا يرون الشاشة ومؤشر الماوس وغير ذلك - لا يعرفون كيف تبدو النافذة والقائمة المنسدلة. بالمناسبة ، بسبب هذا ، ينشأ فارق بسيط آخر غير واضح - قد يكون المكفوفين رهائن لشهادة المركب المستخدم. لذلك ، قبل خمس سنوات ، عند التبديل إلى Windows 8 ، واجه الكثيرون نقص الدعم لتطبيقات 64 بت من مُركِّبات الكلام وتحولوا إلى RhVoice ، حيث تم تنفيذ هذا الدعم بالفعل.



لكن دعنا نعود إلى الأوقات التي كانت فيها أولغا قد بدأت للتو في استكشاف منطقة جديدة بنفسها. ثم كان مُركِّب الكلام هو برنامج Digalo بصوت نيكولاي. هذه حزمة أساسية لدرجة أن نتائج عملها سمعها على الإطلاق أي شخص دخل على الإنترنت. يمكن اعتبار صوته مرادفًا لمصطلح "آلي" ، لذلك دخل عن كثب في ثقافة الإنترنت واستخدم في عدد لا نهائي من مقاطع الفيديو على YouTube. ربما هذا هو السبب في أن الغالبية المطلقة متأكدة من أن Digalo هو لقب نيكولاي. 





Digalo نيكولاي بكل مجدها



البدء في مشروعك الخاص



بدأت رحلة Olga في عالم آلات النطق حوالي عام 2010 مع تطوير محرك NVDA (الوصول غير المرئي لسطح المكتب) لمُركِّب المهرجان. NVDA هو قارئ شاشة مجاني يسمح لضعاف البصر والمكفوفين بالتفاعل الكامل مع أجهزة الكمبيوتر الخاصة بهم. تشتمل فئة مماثلة من البرامج على آلة النطق والقدرة على الإخراج إلى شاشة برايل.



بفضل المهرجان ، انغمست Olga في عالم آلات النطق واكتشفت أنه ليس فقط الشركات التجارية ، ولكن أيضًا أي شخص يريد أن تتاح له الفرصة لجعل الكمبيوتر يتحدث. في ذلك الوقت ، كان هناك بالفعل العديد من آلات تركيب الكلام المفتوحة ، والتي تم توزيعها بشكل أساسي من قبل العلماء الذين يدرسون تقنيات تركيب الكلام.



لذلك ، أجرت أولغا تجاربها الأولى بناءً على أعمال زملائها الأكثر خبرة في نفس المهرجان. إنه مركب كلام أكاديمي تم إنشاؤه في عام 1995 من قبل مجموعة من العلماء بقيادة آلان بلاك. لقد طوروا طرقًا في التوليف واستناداً إلى أبحاثهم قاموا بصنع جهاز المزج الخاص بهم ، والذي كان في الأصل مجرد عرض لنتائج عملهم. بمرور الوقت ، تمت إضافة FestVox إلى مشروع مهم بنفس القدر ، مما يسمح لك بتوليد أصوات اصطناعية جديدة ، وفوق ذلك تم تزويده بوثائق جيدة جدًا. في ذلك الوقت ، كان المهرجان يحتوي بالفعل على صوت الإسكندر الروسي مع قاعدة خطاب جيدة جدًا.



ما هي قاعدة الكلام: في حالة RhVoice ، هذه أكثر من ألف جملة خاصة ، يقرأها متحدث بنطق واضح وعديم المشاعر. يجب اختيار هذه الجمل بطريقة تحتوي على جميع الديفونات ، أي كل مجموعات من صوتين. وسيكون من الجيد لو كان كل عدة مرات لمزيد من التباين. وفقًا للذكريات ، تم استخدام حوالي 600 عبارة في الإصدارات الأولى. علاوة على ذلك ، يمكن أن يشكل المركب أي كلمة من هذه الأصوات. في اللغة الإنجليزية ، تسمى هذه الطريقة اختيار الوحدة ، وفي بلدنا تُعرف باسم طريقة اختيار وحدات الكلام. نعم ، ليس الأكثر أناقة وشبابًا ، لكنه يعمل بشكل موثوق مثل الحديد. يتم إدخال كل جملة في قاعدة البيانات وتحليلها: يتم تحديد الأصوات ومواقعها في المقاطع والكلمات والجمل. يتم تصنيف الصوتيات الفردية ،موقعهم بالنسبة لبعضهم البعض وهلم جرا. أثناء العملية العكسية ، أي تركيب الكلام ، لكل صوت تم الحصول عليه من النسخ ، يمكنك ببساطة اختيار المثال الأنسب (اقرأ: الإغلاق) من قاعدة البيانات. في بعض الأحيان يكون من الممكن العثور على مراسلات صارمة ، وأحيانًا يجب أن تكون راضيًا عن أكثرها تشابهًا. في عالم فقه اللغة ، يسمى هذا علم الصوتيات النظري والعملي ولم يتم اختراعه بالأمس. لذلك ، من المستحيل الانخراط في آلات النطق دون قراءة الكتب المدرسية حول الصوتيات. بالمناسبة ، تم نشر كتب مدرسية جيدة بشكل خاص في جامعة موسكو الحكومية.في عالم فقه اللغة ، يسمى هذا علم الصوتيات النظري والعملي ولم يتم اختراعه بالأمس. لذلك ، من المستحيل الانخراط في آلات النطق دون قراءة الكتب المدرسية حول الصوتيات. بالمناسبة ، تم نشر كتب مدرسية جيدة بشكل خاص في جامعة موسكو الحكومية.في عالم فقه اللغة ، يسمى هذا علم الصوتيات النظري والعملي ولم يتم اختراعه بالأمس. لذلك ، من المستحيل الانخراط في آلات النطق دون قراءة الكتب المدرسية حول الصوتيات. بالمناسبة ، تم نشر كتب مدرسية جيدة بشكل خاص في جامعة موسكو الحكومية.



ومن أين تحصل على هذه العروض؟ يمكنك الكتابة بنفسك ، لكن هذه مهمة صعبة إلى حد ما وهناك طريقتان بديلتان. يمكنك أخذ نص مكتوب من قبل شخص ما مسبقًا ، ولكن هذا قد ينتهك حقوق الطبع والنشر أو يكلف أموالًا فردية. لذلك ، يستخدم مؤلفو بعض الأصوات نصوصًا من ويكيبيديا. بالنسبة للغات الكبيرة مثل الإنجليزية أو الروسية ، يمكنك بسهولة العثور على الأمثلة الضرورية هناك. اللغات الصغيرة ليست محظوظة بهذا المعنى. على سبيل المثال ، هذه الحيلة لم تنجح مع ويكيبيديا البيلاروسية.



ما الفرق بين اللغة والصوت؟ بعد كل شيء ، قبل سبع سنوات لم يكن هناك مذيع أوكراني أو تتاري. كيف تظهر في المركب؟



الأصوات في آلات النطق



يبدأ كل شيء بتحليل اللغة ، والذي يتكون من إنشاء قاعدة بيانات يتم فيها وصف النظام الصوتي لهذه اللغة رسميًا. يمكن بالفعل إنشاء مثل هذه القواعد بواسطة شخص ما وبيعها في السوق (مقابل أموال جيدة جدًا). خلاف ذلك ، عليك أن تفعل ذلك بنفسك. لتحليل كل لغة ، يتم تطوير برنامج منفصل ويمكن أن يستغرق هذا ما يصل إلى عام ونصف من العمل ، اعتمادًا على مدى تعقيد اللغة. على سبيل المثال ، تعتبر اللغة الإيطالية بسيطة للغاية من حيث تركيب الكلام ، بينما تعد لغات مثل العربية والصينية معقدة للغاية. ولكن في المتوسط ​​، يتم إنشاء محلل لغة في عام. بعد استعداده ، تمت كتابة الصوت بالفعل. لقد استغرق هذا حوالي ثلاثة أشهر. يستغرق تسجيل الصوت وغيره من الأعمال في الاستوديو من أسبوعين إلى ثلاثة أسابيع. هذا يرجع إلى الحقيقةيمكن للمتحدث التحدث بجودة وجمال لمدة أربع ساعات في اليوم. ثم يشعر بالتعب ولم يعد يبدو نظيفًا بدرجة كافية. إذا كنت تعتقد أن هذا مجرد حماقة ، فعندئذ لا - يتم فرض متطلبات خطيرة للغاية على جودة هذه السجلات. تقوم الشركات التجارية بإجراء عمليات الصب بالكامل ، ولا تختار فقط الجمال الشخصي للصوت ، ولكن أيضًا ، إن أمكن ، تستخدم صوتًا معينًا للغة معينة في آلة النطق الخاصة بهم.



ثم يتم تقسيم السجل إلى أجزاء وفقًا لقاعدة البيانات ، ثم باستخدام محلل اللغة ، يتم دمج هذه الأجزاء معًا. بمعنى ، تم إجراء تحليل على أن هذا اسم ، هذا فعل ، إنه يقف بجانب هذا ، مما يعني أنه يجب أن يبدو مثل هذا ويتم استبدال أقرب صوت. لذا فإن دور المحلل مهم للغاية: يجب أن يأخذ في الاعتبار ليس فقط ترتيب المقاطع في الكلمة ، ولكن أيضًا ترتيب الكلمات في الجملة وعلامات الترقيم. كل هذا يؤثر على النطق. في بعض اللغات ، يمكن نطق نفس الكلمة بشكل مختلف ، اعتمادًا على ما إذا كانت اسمًا أم فعلًا.



لكن هذا يعد طريقًا للمنتجات التجارية ، حيث يمتلك المبدعون الموارد اللازمة لمثل هذا البحث المتعمق. يستخدم المطورون المستقلون خيارات أبسط: بدون تصنيف كامل حسب أجزاء الكلام ، ولكن ، على سبيل المثال ، فقط على مستوى كلمة / حرف جر / اتحاد مستقل ، إلخ. اتخذت أولغا طريقها الخاص إلى أبعد من ذلك وكتبت وحدة لغتها بناءً على الكتب المدرسية والمقالات حول الصوتيات. لحسن الحظ ، هناك عدد كافٍ من الدراسات المنشورة حول هذا الموضوع.



هل لاحظت أن معظم آلات المزج لها أصوات أنثوية أولاً؟ هذا ليس بسبب تفضيلات المؤلفين ، ولكن بسبب تعقيد تطوير صوت أنثوي. الصوت الأنثوي أعلى بشكل طبيعي ، وتكون معالجة الترددات العالية أكثر صعوبة من الترددات المنخفضة. وإذا كان بإمكانك إنشاء صوت أنثوي ، فمن المؤكد أن صوت الذكر سينجح. ولكن على العكس من ذلك ، ليست حقيقة.





في حالة أولغا ، هذا هو شغف شخصي بالموضوع وحتى ضرورة. ماذا عن التنمية التجارية؟ كيف يقررون أي لغة يجب إضافتها وأيها لا؟ الجواب على كل شيء هو المال. الخيار الأول الواضح هو تحليل سوق مبيعات محتمل لأصوات جديدة. وببساطة: ما هو المستوى الاقتصادي للبلد وما إذا كان سكانها يملكون المال لشراء منتجاتهم. الحافز الثاني هو بالفعل أكثر إثارة للاهتمام. إنها رغبة الحكومة أو المنظمات الأخرى في إنشاء تركيب الكلام للغة معينة. لذلك ، تم تصنيع آلات تركيب الكلام للغات صغيرة جدًا ، وذلك ببساطة لأن شخصًا ما اعتنى بذلك وخصص أموالًا للتنمية. وعلى سبيل المثال ، توجد في الدول الاسكندنافية قوانين تنص على أن جميع الوثائق المكتوبة يجب أن تكون في متناول المكفوفين وضعاف البصر. لذلك ، يجب أن يكون لأي صحيفة منشورة نسختها الصوتية الخاصة.



ولفهم ترتيب الأسعار: تطوير صوت جديد ، من الشركات الخاصة ، يكلف حوالي عشرة إلى أربعين ألف يورو ، اعتمادًا على مدى تعقيد اللغة. تطوير وحدة المحلل يكلف عدة مرات. فيما يتعلق بـ RhVoice ، تتمتع Olga بموقع مبدئي - سيكون مشروعها دائمًا مجانيًا. ثم من أين تأتي أموال المذيعين؟ في المراحل الأولى ، كان هناك متطوعون قدموا المساعدة. كان لديهم استوديو خاص بهم وعرضوا الدفع للمذيع ، لذلك كان على أولغا فقط إرسال قائمة من المقترحات للدبلجة. هذه هي الطريقة التي ظهرت بها عدة لغات جديدة في RhVoice. ثم بدأوا يلجئون إليها بطلبات محددة.



لكن مصير المزيد من التطوير يعتمد على إيجاد الموارد اللازمة في الوصول المجاني. على سبيل المثال ، لم يكن هناك قاموس مفتوح للضغوط للغة الأوكرانية من قبل ، ومن المستحيل بناء مُركِّب دون معرفة كيفية وضع الضغوط. الآن تمت إضافته بالفعل ، ولكن تم إنجاز الكثير من العمل. اللغة الروسية أكثر حظًا من حيث توافر المواد. وتم إتاحة الصوت الكنسي "ألكساندر" للجمهور من قبل مبتكره ، وبفضل ذلك تمكنت أولغا من بدء تجاربها الأولى في إنشاء آلة النطق.



كيف يمكنك إنشاء مُركب إذا كنت لا تعرف اللغة على الإطلاق؟ تقليديا ، هل تعرف الروسية والإنجليزية ، ولكن هل يُطلب منك تطوير اللغة العربية؟ لا توجد قيود فنية ، الشيء الرئيسي هو أن تجد على الإنترنت بعض المقالات والمواد حول اللغة ، حول هياكلها ، أو حتى استشارة عالم فقه اللغة. قد يكون هذا كافيًا لتطوير مُركِّب حديث أولي. في الواقع ، بشكل عام ، فإن مقدار معلومات البداية قياسي: قائمة الأصوات ، وقواعد النسخ من تمثيل الحروف إلى النطق ، وتفاصيل حول الأجزاء المساعدة من الكلام ، إلخ. ستكون المشكلة الرئيسية أن المطور لا يمكنه التحقق من نتائج عمله دون مشاركة متحدث أصلي. ولا ينبغي للمتحدث الأصلي أن يعطي ملاحظات واضحة / غير مفهومة فحسب ، بل يجب أن يشرح أيضًا كل التفاصيل الدقيقة والفروق الدقيقة في الأماكن التي حدث فيها خطأ ما. في حالة RhVoice ، أصبحت التتار لغة صعبة.ساعد علماء فقه اللغة أولغا كثيرًا معه ، حيث كانت مرتبطة به من قبل ممثلي مكتبة قازان للمكفوفين والمعاقين بصريًا ، الذين بدأوا هذه الأعمال. في سياق العمل على آلة النطق ، تم تجميع قاموس منفصل للنطق الصحيح للكلمات المستعارة من اللغة الروسية. بحيث تبدو الاستعارات وفقًا لقواعد لغة التتار تمامًا ، وليس وفقًا لقواعد لغة التتار. ومن الجيد أن مثل هذا القاموس تم تأليفه من قبل علماء فقه اللغة المحترفين على سبيل المثال ، لا يوجد مثل هذا القاموس للقرغيز ، وهناك الكثير من مجالات المشاكل ، وطرق حلها التي لم يتم العثور عليها بعد من الناحية الفنية.أثناء العمل على آلة النطق ، تم تجميع قاموس منفصل للنطق الصحيح للكلمات المستعارة من اللغة الروسية. بحيث تبدو الاستعارات وفقًا لقواعد لغة التتار تمامًا ، وليس وفقًا للغة الروسية. ومن الجيد أن مثل هذا القاموس تم تأليفه من قبل علماء فقه اللغة المحترفين. على سبيل المثال ، لا يوجد مثل هذا القاموس للقرغيز ، وهناك الكثير من مجالات المشاكل ، وطرق حلها التي لم يتم العثور عليها ببساطة من الناحية الفنية.في سياق العمل على آلة النطق ، تم تجميع قاموس منفصل للنطق الصحيح للكلمات المستعارة من اللغة الروسية. بحيث تبدو الاستعارات وفقًا لقواعد لغة التتار تمامًا ، وليس وفقًا لقواعد لغة التتار. ومن الجيد أن مثل هذا القاموس تم تأليفه من قبل علماء فقه اللغة المحترفين. على سبيل المثال ، لا يوجد مثل هذا القاموس للقرغيز ، وهناك الكثير من مجالات المشاكل ، وطرق حلها التي لم يتم العثور عليها بعد من الناحية الفنية.



مشكلة منفصلة هي وضع الضغط. في بعض اللغات ، يمكن التنبؤ بموقع الضغط ، ولكن في نفس الروسية والأوكرانية ، لا يمكن الاستغناء عن القاموس. علاوة على ذلك ، هناك خوارزميات للتنبؤ بالإجهاد تعتمد على هذه القواميس. لكن القيام بذلك دون امتلاك مفردات أساسية أمر مستحيل.



ماذا في المستقبل؟ بدلاً من ذلك ، ما هي الوظائف الجديدة ، أو التحسينات على الوظائف الحالية ، التي يطلبها المستخدمون غالبًا؟ القائد بلا منازع هنا هو طلب لإضافة لغة أو أخرى. يجري العمل على لغات جديدة ، ولكن كما ذكرنا سابقًا ، هذا ليس سريعًا جدًا ويعتمد على مساعدة متخصصين خارجيين. ويطلب الكثير من الأشخاص أيضًا تحسين جودة الصوت لجعله أقرب إلى الطبيعي. ومع ذلك ، مع الأدوات المتاحة لأولغا ، لن يكون هناك تحسينات كبيرة هنا. صحيح ، من إصدار إلى آخر ، لا يزال يتم إجراء التغييرات في الصوت.



تأمل أولجا الآن في أن تكون هناك مكونات جاهزة للشبكات العصبية مكتوبة بلغات منخفضة المستوى مثل C والتي يمكن أن توفر أداءً كافيًا على الأجهزة المحمولة. وإذا بدأ على الهواتف المحمولة ، فسيعمل على منصات أخرى. يتم تطوير مثل هذه المشاريع بالفعل ، وبعد ذلك ستتمكن من إعادة صياغة آلة النطق الخاصة بها. هناك مشكلة أخرى يجب حلها وهي أنه لا توجد طريقة بسيطة ومباشرة لإضافة لغتك وصوتك في RhVoice. هناك أشخاص مستعدون للدفع مقابل هذا العمل ، لكن المشكلة تكمن في الكلاسيكو: هناك الكثير من الطلبات ، أولجا واحدة ، وكما هو الحال في معظم المشاريع الممتعة ، فإن قاعدة الشفرة هي غابة سحرية لدرجة أنها مهمة مميتة لشخص آخر غير المبدع لمعرفة ذلك. ... في معظم هذه المشاريع ، يقدم المطورون مجموعة من الأدوات والوثائق ،يمكنك من خلالها ، من خلال معرفة صوتيات اللغة والحصول على بقية المعرفة ، إنشاء وحدة اللغة الخاصة بك. حتى الآن ، ليس لدى أولغا هذا ولا الآخر. لكن هناك خطط للقيام بذلك.



في الختام ، أود أن أقول إنه على هذا النحو ، وبفضل شخص واحد متحمس ، تم إنجاز عمل جيد للغاية لسنوات عديدة. شكرا لك أكثر يا أولجا.



إذا كنت تريد أيضًا أن تشكر Olga على عملها غير الأناني ، أو حتى المشاركة في تطوير RhVoice ، أو ساعد المشروع بمعرفتك أو أفضل الممارسات أو الرعاية ، فيمكنك القيام بذلك عن طريق الاتصال بـ Olga من خلال github الخاص بها .





All Articles