OCR בעזרת רשת עצבית בJavaScript
מאת Fate בתאריך 08/01/09, תחת כללי
כן כן, שמעתם טוב…
מכירים את האתר Megaupload?
זה כמו Rapidshare, אבל עם CAPTCHA הרבה יותר פשוטה של 3 אותיות.
מי שלא מכיר את הCAPTCHA, הנה לינק לדוגמה להורדה: http://www.megaupload.com/?d=X03HFLP1
(מצד ימין יש 3 אותיות)
כולם יודעים שCAPTCHA נועדה למנוע רובוטים שינסו להוריד את הקובץ בצורה אוטומטית,
וחלק אפילו יודעים שיש אפשרות לנסות לעשות זיהוי Optical Character Recognition או בקצרה OCR.
אבל אני לא חושב שמישהו פה ראה סקריפט Javascript שמממש את זה,
ואפשר להשתמש בו Live מול האתר בעזרת Add-on לFirefox שקוראים לו Greasemonkey.
התוסף מאפשר הרצת סקריפטים מסויימים עבור אתר כשנכנסים אליו.
הלינק הקודם שהבאתי, (http://www.megaupload.com/?d=X03HFLP1)
מכיל הורדה של התוסף, וגם של הסקריפט שעושה זיהוי אוטמטי עם הCAPTCHA של Megaupload.
מי שלא מעניין אותו השלמה אוטמטית של הCAPTCHA לפחות יעניין אותו איך בנוי הסקריפט.
הסקריפט מממש רשת עצבית מלאכותית ומגיע עם המשקלים המתאימים כדי לזהות את הCAPTCHA.
מי שמעניין אותו לקרוא על Artificial Neural Networks מוזמן ללמוד על זה מ:
http://en.wikipedia.org/wiki/Artificial_neural_network
הנה חלק מהסקריפט עם כמה מהמשקלים:
function create_net() { //pre-calculated weights var h_weights = [[-0.126359597761, [-0.58837191446576764, 0.036755965405260743 , 0.51854514831840781, -0.43431581850621709, 1.0754289255168701 , -0.64799960752449348, 1.1940698464323356, -0.86824098689125395 , 0.29366831980315877, -0.89830849234532661, -0.43654295013922195
21/02/09 בשעה 16:01
מצאתי איזה קישור למידע בעברית על רשתות עצביות.
http://www1.snunit.k12.il/heb_journals/kimat2000/004020.html
מקווה שזה עוזר להבין 🙂