تجربة في التعرف على النصوص المكتوبة بخط اليد باللغة السيريلية

المقدمة





التعرف على النص المكتوب بخط اليد (HTR) هو طريقة تلقائية لفك تشفير السجلات باستخدام الكمبيوتر. من شأن الشكل الرقمي للملاحظات المكتوبة بخط اليد أن يعمل على أتمتة العمليات التجارية للعديد من الشركات ، مما يجعل العمل البشري أسهل. في هذه الورقة ، نعتبر نموذجًا للتعرف على النص المكتوب بخط اليد باللغة السيريلية بناءً على شبكة عصبية اصطناعية. استخدمت الدراسة SimpleHTR النظام التي وضعتها هارالد، وكذلك LineHTR ، نسخة موسعة من HTR بسيط نظام  . يمكنك قراءة المزيد عن SimpleHTR هنا .





مجموعة البيانات





في هذا القسم ، سأصف نوعين من مجموعات البيانات: تحتوي مجموعة البيانات الأولى على اقتباسات مكتوبة بخط اليد باللغة السيريلية. يحتوي على 21000 صورة من مختلف نماذج الكتابة اليدوية (أسماء البلدان والمدن). لقد عززنا مجموعة بيانات التدريب هذه من خلال جمع 207438 صورة من الأشكال أو العينات المتاحة.





تتألف قاعدة بيانات اللغة الكازاخستانية الثانية لقاعدة البيانات الكازاخستانية الروسية المكتوبة بخط اليد من كلمات مفردة (أو عبارات قصيرة) مكتوبة باللغتين الروسية والكازاخستانية (حوالي 95٪ روسية و 5٪ كازاخستانية كلمة / جملة ، على التوالي). لاحظ أن كلتا اللغتين مكتوبتان بالسيريلية وتتشاركان في نفس 33 حرفًا. بالإضافة إلى هذه الرموز ، هناك 9 رموز محددة أخرى في الأبجدية الكازاخستانية. بعض الأمثلة على مجموعة بيانات HKR موضحة أدناه: 









بعض عينات مجموعة البيانات
بعض عينات مجموعة البيانات

(70%), (15%) (15%) . ( 7,5% ): TEST1 , ; TEST2 , , . TEST1 TEST2 , , .





SimpleHTR





ANN, CNN . RNN. RNN . RNN . RNN. CTC . . CTC ; RNN , . CTC . , , , . , , , , .





: CNN: CNN. . 55 33 . RELU , , . 2 , () , ( ) 32 256. RNN: 256 . . LSTM- RNN, , . RNN 3280.





CTC: RNN , . CTC . 32













نموذج SimpleHTR ، حيث تكون الرموز الخضراء عمليات والوردي عبارة عن تدفقات بيانات
SimpleHTR, - , -

: : 128 32. , ( ) , 128 32 . 128 32 . , .









LineHTR

LineHTR - SimpleHTR, , ( ), , . LineHTR SimpleHTR, CNN RNN : 7 CNN 2 Bidirectinal LSTM (BLSTM) RNN. 





LineHTR:





  • 800 x 64 ( x ).





  • CNN 100 x 512.





  • BLSTM 512 100 x 205: 100 ( ) ; 205 )





  • CTC 2 : LOSS - ; -





  • 50









Python deep learning Tensorflow. Tensorflow Python. Python , . matplotlib Python, Inkscape- , Adobe Photoshop. 2- " Intel ® Xeon(R) E-5-2680”, 4x " NVIDIA Tesla k20x” 100 RAM. 3 , , .





SimpleHTR





SimpleHTR - , . , :









• DataLoader





• : 90% 10% . : -, , ; -, CNN ; -, ; -, , , , .





: SimpleHTR, 42 . 10 . : . , .





















CER





WAR





CER





WAR





bestpath





19.13





52.55





17.97





57.11





beamsearch





18.99





53.33





17.73





58.33





wordbeamsearch





16.38





73.55





15.78





75.11









SimpleHTR (bestpath, beamsearch, wordbeamsearch). NN , . NN, , , . character-LM , .





:





نتائج التجربة باستخدام SimpleHTR (lr = 0.01): دقة النموذج.
SimpleHTR (lr=0,01): .
نتائج التجربة باستخدام SimpleHTR (lr = 0.01): خطأ في النموذج.
SimpleHTR (lr=0,01): .

, , " ” 86 .









مثال على صورة مع عبارة "جنوب كازاخستان" باللغة الروسية
" -”





نتيجة الاعتراف

(HKR Dataset): SimpleHTR 20,13% (CER) 1,55% CER. SimpleHTR ( ). (WER) 58,97% 1 11,09% 2. TEST2 . TEST1 , , , .













LineHTR, 100 . CAR 29,86% 86,71% TEST1 TEST2 ( ). .









SimpleHTR LineHTR : 57,1% SimpleHTR CNN , 58,3% Beamsearch 75,1% wordbeamsearch. Wordbeamsearch, .








All Articles