უკუპროპაგაციული მოდელი

ნეირონული ქსელის უკუპროპაგაციული მოდელი, ან უბრალოდ უკუპროპაგაციული მოდელი — ხელოვნური ნეირონული ქსელის ერთ-ერთი ყველაზე გავრცელებული მაგალითი. ის გამოიყენება ხელნაწერი ასოების, ბირჟაზე ფასების ცვლილების და სხვა რთულად გამოთვლადი სტრუქტურის ამოსაცნობად.

მუშაობის პრინციპი[რედაქტირება | წყაროს რედაქტირება]

უმარტივესი უკუპროპაგაციული მოდელი შედგება ერთი შემომავალი შრისგან, ერთი გასავალი შრისგან და მათ შორის მდებარე ერთი შიდა (დამალული) შრისგან. შესაძლებელია ორი ან მეტი შიდა შრის გამოყენება, თუმცა ეს ნაკლებადაა გავრცელებული, რადგან დაკავშირებულია მეტ გამოთვლასთან. მეზობელი შრეების ნეირონები ერთმანეთთან სრულად არიან დაკავშირებულები (ანუ ერთი შრის ნეირონი წახნაგებით არის დაკავშირებული მეორე შრის ყველა ნეირონთან).

შემომავალ და გამავალ შრეზე ნეირონების რაოდენობა განისაზღვრება კონკრეტული ამოცანიდან გამომდინარე. ასე მაგალითად თუ გვინდა 100x100 პიქსელის ზომის გამოსახულების ამოცნობა, დაგვჭირდება 10 000 შემომავალი ნეირონი: თითო ყოველ პიქსელზე. შიდა შრის ნეირონების რაოდენობა დგინდება ექსპერიმენტალურად: თუ რომელი რაოდენობისთვის არის ქსელი ყველაზე სწრაფად კრებადი.

უკუპროპაგაციული მოდელი მიეკუთვნება ცალმხრივად გავლად მოდელებს. მასში სიგნალი გადის მხოლოდ ერთი მიმართულებით: შემომავალი შრიდან გამავალ შრეზე, ყველა შიდა შრის გავლით. შრეებს შორის სიგნალის გავლისთვის ვიყენებთ ზოგად პრინციპს, როგორც ეს ხელოვნურ ნეირონულ ქსელშია აღწერილი. კერძოდ კი, შემომავალ ნეირონებზე მოდებული საწყისი სიგნალი $\mathbf {x} =(x_{1},x_{2},...,x_{n_{i}})$ აისახება ჯამურ შეწონილად პირველი შიდა შრის ნეირონებზე. თუ ავღნიშნავთ $w_{ij}$ წახნაგის წონას, რომლითაც $i$ -ური შემომავალი ნეირონი უკავშირდება $j$ -ურ შიდა შრის ნეირონს, მაშინ საშუალო შეწონილი $j$ -ურ შიდა შრის ნეირონზე იქნება $net_{j}=\sum _{i=0}^{n_{i}}{w_{ij}x_{i}}$ . გამოსავალი $j$ -ურ შიდა შრის ნეირონზე იქნება ტოლი $o_{j}=f(net)j)$ , სადაც $f$ არის აქტივაციის ფუქნცია. როგორც წესი აქტივაციის ფუნქცია არის სიგმოიდი წანაცვლებით, $f(net_{j})={\frac {1}{1+exp\{-(net_{j}+\theta _{j})\}}}$ . ანალოგიურად ხდება სიგნალის გატარება პირველი შიდა შრიდან შემდეგ შრეზე და ა. შ. გამოსავლამდე.

გამოსავალზე მიღებული შედეგი წარმოადგენს "პასუხს", რომლის დადარება უნდა მოხდეს მოსალოდნელ პასუხთან. თუ მიღებული პასუხი არ ემთხვევა მოსალოდნელს, მაშინ ჩვენ უნდა მოვახდინოთ ქსელის წახნაგების წონების კორექტირება და კიდევ ერთხელ ვცადოთ სიგნალის გატარება, და ასე სანამ ქსელი არ მოგვცემს სასურველ შედეგს. ანალოგიური ციკლი უნდა ჩატარდეს რაც შეიძლება მეტი საწყისი სტრუქტურისათვის. ასე მაგალითად, თუ გვინდა ნეირონული ქსელის გამოყენება ხელნაწერი ასოების ამოსაცნობად, უნდა "ვასწავლოთ" ქსელს რაც შეიძლება მეტი ხელნაწერი ასოების ამოცნობა, შესაბამისი შემავალი და გამავალი სტრუქტურის მიწოდებით.

როდესაც ნეირონული ქსელი საკმარისადაა "ნასწავლი" ის ავლენს უნარს ამოიცნოს არა მარტო სწავლის პერიოდში შესწავლილი სტრუქტურები, არამედ სხვა ანალოგიური სტრუქტურებიც.

რადგან უკუპროპაგაციული მოდელი მოითხოვს საწყისი სწავლის კურსს ადამიანის მონაწილეობით, ამიტომ ამ მოდელს მიაკუთვნებენ დამოძღვრად ჯგუფს.