المقدمة
التعرف على النص المكتوب بخط اليد (HTR) هو طريقة تلقائية لفك تشفير السجلات باستخدام الكمبيوتر. من شأن الشكل الرقمي للملاحظات المكتوبة بخط اليد أن يعمل على أتمتة العمليات التجارية للعديد من الشركات ، مما يجعل العمل البشري أسهل. في هذه الورقة ، نعتبر نموذجًا للتعرف على النص المكتوب بخط اليد باللغة السيريلية بناءً على شبكة عصبية اصطناعية. استخدمت الدراسة SimpleHTR النظام التي وضعتها هارالد، وكذلك LineHTR ، نسخة موسعة من HTR بسيط نظام . يمكنك قراءة المزيد عن SimpleHTR هنا .
مجموعة البيانات
في هذا القسم ، سأصف نوعين من مجموعات البيانات: تحتوي مجموعة البيانات الأولى على اقتباسات مكتوبة بخط اليد باللغة السيريلية. يحتوي على 21000 صورة من مختلف نماذج الكتابة اليدوية (أسماء البلدان والمدن). لقد عززنا مجموعة بيانات التدريب هذه من خلال جمع 207438 صورة من الأشكال أو العينات المتاحة.
تتألف قاعدة بيانات اللغة الكازاخستانية الثانية لقاعدة البيانات الكازاخستانية الروسية المكتوبة بخط اليد من كلمات مفردة (أو عبارات قصيرة) مكتوبة باللغتين الروسية والكازاخستانية (حوالي 95٪ روسية و 5٪ كازاخستانية كلمة / جملة ، على التوالي). لاحظ أن كلتا اللغتين مكتوبتان بالسيريلية وتتشاركان في نفس 33 حرفًا. بالإضافة إلى هذه الرموز ، هناك 9 رموز محددة أخرى في الأبجدية الكازاخستانية. بعض الأمثلة على مجموعة بيانات HKR موضحة أدناه:
(70%), (15%) (15%) . ( 7,5% ): TEST1 , ; TEST2 , , . TEST1 TEST2 , , .
SimpleHTR
ANN, CNN . RNN. RNN . RNN . RNN. CTC . . CTC ; RNN , . CTC . , , , . , , , , .
: CNN: CNN. . 55 33 . RELU , , . 2 , () , ( ) 32 256. RNN: 256 . . LSTM- RNN, , . RNN 3280.
CTC: RNN , . CTC . 32
: : 128 32. , ( ) , 128 32 . 128 32 . , .
LineHTR
LineHTR - SimpleHTR, , ( ), , . LineHTR SimpleHTR, CNN RNN : 7 CNN 2 Bidirectinal LSTM (BLSTM) RNN.
LineHTR:
800 x 64 ( x ).
CNN 100 x 512.
BLSTM 512 100 x 205: 100 ( ) ; 205 )
CTC 2 : LOSS - ; -
50
Python deep learning Tensorflow. Tensorflow Python. Python , . matplotlib Python, Inkscape- , Adobe Photoshop. 2- " Intel ® Xeon(R) E-5-2680”, 4x " NVIDIA Tesla k20x” 100 RAM. 3 , , .
SimpleHTR
SimpleHTR - , . , :
•
• DataLoader
• : 90% 10% . : -, , ; -, CNN ; -, ; -, , , , .
: SimpleHTR, 42 . 10 . : . , .
|
|
|
|
||
CER |
WAR |
CER |
WAR |
|
bestpath |
19.13 |
52.55 |
17.97 |
57.11 |
beamsearch |
18.99 |
53.33 |
17.73 |
58.33 |
wordbeamsearch |
16.38 |
73.55 |
15.78 |
75.11 |
SimpleHTR (bestpath, beamsearch, wordbeamsearch). NN , . NN, , , . character-LM , .
:
, , " ” 86 .
(HKR Dataset): SimpleHTR 20,13% (CER) 1,55% CER. SimpleHTR ( ). (WER) 58,97% 1 11,09% 2. TEST2 . TEST1 , , , .
LineHTR, 100 . CAR 29,86% 86,71% TEST1 TEST2 ( ). .
SimpleHTR LineHTR : 57,1% SimpleHTR CNN , 58,3% Beamsearch 75,1% wordbeamsearch. Wordbeamsearch, .