
هذه نسخة محسنة من منشوري على Medium .
مؤخرًا ، أثناء جلوسي في حانة مع صديق ، بدأت محادثة حول المهام ، من حيث المبدأ ، يمكن أن يكون نهج الشبكة العصبية فعالًا ، وأين تكون زائدة عن الحاجة تمامًا. فئة واحدة من الأمثلة التي غالبًا ما تكون فيها الشبكات العصبية أعلى من الخوارزميات الكلاسيكية هي معالجة الصور. يمكن أن تتجاوز دقة حل مشكلة التعرف على الأشياء في الصورة الإدراك البشري. بالإضافة إلى ذلك ، فإن مهام نقل الأسلوب ، وإنشاء صور واقعية ، ودقة فائقة ، وما إلى ذلك هي مهام مثيرة للاهتمام. يمكن أن تكون الشبكات العصبية فعالة جدًا أيضًا في مهام مثل pixtopix ، عندما يتم إنشاء صورة من صورة أخرى. ثم خطرت لي فكرة محاولة تطبيق هذه الخوارزميات لتحويل الأفلام ثنائية الأبعاد إلى ثلاثية الأبعاد.
حول المهمة
3 100 - . - , . 3. 2 , 6.5 2 . 3 .
- . , . , () , . - . , . , , , - . , ( , ). . , , , . .

, . , , . .
— .

, , , — , . , , , . , , . , . — . . , , .
, , ( transfer learning)
3d google cardboard vr. - .
3D . 200 , . , , 2 - . OverUnder, Side-by-Side. OverUnder , . . . Uf Df:
Uf , Df . . CoordConv - , . CoordConv input - , ( CoordConv keras ). :
end-to-end . , ( , , ):
,
1. ( https://github.com/ialhashim/DenseDepth ). .
2. Skip-connections —
3. ( CoordConv [https://arxiv.org/pdf/1807.03247.pdf ], 2 numpy, )
4. , Residual — , — .
, . mse, structural similarity loss ( , ) loss, , VGG16.
DenseDepth : ( custom_objects kaggle). nyu.h5
( kaggle):
, . , , - 2 , " ". gif :
:


, gif . , 2d. ( side-by-side):
, ( gtx1060 3gb) 1 100 1 . , gpu 3d - .
ffmpeg:
ffmpeg -i output.mp4 -i inputvideo.mp4 -map 0:v -metadata stereo_mode=1 output.mkvGoogleColab
GPU , googleColab, gpu . . run . 1 1 . .

, , 3d . 1 2 3. , , . , , ( , , ).
, youtube . - . ( youtube Sidebyside )
, . googleColab 2D- 3D. ( ). 3d /TV VR- GoogleCardboard