ქართული ენის ეროვნული კორპუსი

მასალა ვიკიპედიიდან — თავისუფალი ენციკლოპედია

ქართული ენის ეროვნული კორპუსი — ვირტუალური სივრცე, რომელიც მოიცავს ქართული ენის ისტორიული არსებობის განმავლობაში შექმნილი წერილობით ძეგლებსა და ქართული ენის ზეპირმეტყველების გაციფრებულ რესურსებს და საშუალებას აძლევს მომხმარებელს, გამოიყენოს იგი ლინგვისტური და ინტერდისციპლინარული - როგორც დიაქრონიული, ისე სინქრონული - კვლევებისათვის. ქართული ენის ეროვნული კორპუსი შეიქმნა საერთაშორისო სამეცნიერო პროექტების ფარგლებში გერმანელი და ქართველი მეცნიერების თანამშრომლობის შედეგად.

ენის ეროვნული კორპუსი[რედაქტირება | წყაროს რედაქტირება]

The Georgian National Corpus project

ენის ეროვნული კორპუსი არის სახელმწიფო ენისათვის შექმნილი ვირტუალური სივრცე, რომელშიც განთავსებულია სახელმწიფო ენის ისტორიული და თანამედროვე მემკვიდრეობა ელექტრონული რესურსების სახით. ენის ეროვნული კორპუსი სახელმწიფო ენის სტატუსით აღჭურვილი ენისათვის შექმნილი კორპუსია, რომელიც გამოიყენება როგორც სახელმწიფო ინტერესებისათვის (სახელმწიფო ენის ნორმალიზაცია-სტანდარტიზაცია, ენის ეკოლოგიის დაცვა, ენობრივი პოლიტიკის დაგეგმვა და ა.შ.), ისე ქვეყანაში მეცნიერების სხვადასხვა დარგის, განსაკუთრებით ციფრული ჰუმანიტარიის განვითარებისათვის. ეროვნული კორპუსი სახელმწიფო ენაზე ზრუნვის განხორციელებისათვის ეფექტიანი და მეთოდურად გამართული საშუალებაა, რაზედაც მეტყველებს, მაგ., ინგლისური ენისათვის შექმნილი სამი კორპუსის არსებობა: ბრიტანული ეროვნული კორპუსი, ამერიკული ეროვნული კორპუსი, ავსტრალიური ეროვნული კორპუსი. მიუხედავად იმისა, რომ სამივე დასახელებული კორპუსი ინგლისური ენის რესურსების ნაკრებს წარმოადგენს, თითოეული მათგანი შესაბამისი ქვეყნის სახელმწიფო ენის (ბრიტანული ინგლისური, ამერიკული ინგლისური, ავსტრალიური ინგლისური) ამსახველი ელექტრონული რესურსების სტრუქტურირებულ მონაცემთა ბანკია.

ქართული ენისათვის ელექტრონული რესურსების შექმნის ისტორია[რედაქტირება | წყაროს რედაქტირება]

ქართული ენისათვის პირველი ელექტრონული რესურსების შექმნა და ქართული დამწერლობის უმნიშვნელოვანესი ძეგლების გაციფრება დაკავშირებულია გერმანელი ქართველოლოგის პროფ. იოსტ გიპერტის სახელთან. ინდოევროპული ენების ისტორიული კორპუსის TITUS (Thesaurus Indogermanischer Text- und Sprachmaterialien) შემქმნელი გერმანელი მეცნიერი ქართველური ენებით ჯერ კიდევ გასული საუკუნის 80-იან წლებში დაინტერესდა და სწორედ ამ პერიოდში დაიწყო ქართული ხელნაწერების ბეჭდური გამოცემების პირველი ციფრული ვერსიის შექმნა ქართული ენის თანამედროვე ტექნოლოგიებით კვლევის მიზნით. ამ პერიოდში იოსტ გიპერტი ახორციელებს ძველი ქართული ენის ძეგლების გაციფრებას და იწყებს ქართული ენის ისტორიული კორპუსისათვის საფუძვლის მომზადებას. პირველი ციფრული კორპუსი ძველი ქართული ენისათვის მოიცავდა ძველ ქართულ ბიბლიურ ტექსტებს, აპოკრიფებსა და კომენტარებს, აგიოგრაფიულ და ჰომილეტიკურ ტექსტებს, როგორიცაა ძველი აღთქმის ოშკისა და იერუსალიმის რედაქცია, ფსალმუნნი (A რედაქცია), პარიზის ლექციონარი, ახალი აღთქმის აპოკრიფები და სხვ. ასევე, წამებაჲ წმიდისა შუშანიკისი, მარტვილობაჲ და მოთმინებაჲ წმიდისა ევსტათი მცხეთელისაჲ, წამებაჲ წმიდისა და ნეტარისი მოწამისა ქრისტესა ჰაბოჲსი, მოქცევაჲ ქართლისაჲ, ცხოვრებაჲ და წამებაჲ წმიდისა მოწამისა კოსტანტინისი ქართველისაჲ, წამებაჲ ყრმათა წმიდათაჲ რიცხვით ცხრათაჲ, ცხოვრებაჲ წმიდისა მამისა ჩუენისა იოვანე ზედაზნელისაჲ (A და B რედაქციები), ცხოვრებაჲ და მოქალაქობაჲ მამისა ჩუენისაჲ დავით გარესჯელისაჲ, მოქალაქობაჲ და წამებაჲ წმიდისა აბიბოს ნეკრესელ ეპისკოპოსისაჲ (A და B რედაქციები), ცხოვრებაჲ და მოქალაქობაჲ და ღუაწლი წმიდისა და ღირსისა დედისა ჩუენისა ნინოჲსი და მრავალი სხვა; ასევე ძეგლები ნათარგმნი აგიოგრაფიული, ჰომილეტიკური და ეგზეგეტიკური ტექსტები S-1141 და Ath-8. (57) ხელნაწერებიდან და სხვ. იოსტ გიპერტის მიერ მომზადებული ძველი ქართული ენის კორპუსი, რომელშიც 100-მდე ტექსტი გაერთიანდა, აღჭურვილი მეტამონაცემებითა და საძიებო სისტემით, განთავსდა ფრანკფურტის უნივერსიტეტის TITUS-ის პლატფორმაზე და დღემდე მოიხმარება მკვლევართა მიერ, როგორც საერთაშორისო მიმოქცევის პროდუქტი.

ქართული ენის კორპუსის შექმნის ისტორია[რედაქტირება | წყაროს რედაქტირება]

TITUS Text Retrieval

ქართული ენის კორპუსისათვის ელექტრონული რესურსების მიზნობრივი შექმნა 1995 წლიდან დაიწყო და რამდენიმე ეტაპად ხორციელდებოდა:

I ეტაპი:[რედაქტირება | წყაროს რედაქტირება]

1995-99 წლებში იოსტ გიპერტი ქართველ მეცნიერებთან თანამშრომლობით იწყებს ქართული ენის ისტორიული კორპუსის გაფართოებას და ძველი და საშუალი ქართულის ელექტრონული რესურსების მომზადებას და მათ განთავსებას TITUS-ის პლატფორმაზე. ამ პერიოდში გიპერტთან აქტიურად თანამშრომლობენ ქართველ მეცნიერთა მთელი პლეადა: ვ. იმნაიშვილი, ზ. სარჯველაძე, ლ. ქაჯაია, დ. თვალთვაძე, ა. ხარანაული, ვ. წამალაშვილი, მ. ბაბუხადია, ლ. ბასილაია, ნ. დობორჯგინიძე, თ კარსანიძე, მ. მაჩხანელი, ნ. შარაშენიძე, თ. ცოფურაშვილი, ნ. შუღლაძე, თ. ცქიტიშვილი, ს. სარჯველაძე, ქ. გოჩიტაშვილი, ნ. დათუკიშვილი, ნ. ლოლაძე, ა. მეფისაშვილი და სხვ.

II ეტაპი:[რედაქტირება | წყაროს რედაქტირება]

1999-2012 წლებში იოსტ გიპერტი ქართველ მეცნიერებთან თანამშრომლობას ფოლკსვაგენის ფონდის მხარდაჭერით საერთაშორისო პროექტების ფარგლებში აგრძელებს. ქართული ენის კორპუსის შექმნის მეორე ეტაპზე კორპუსის შექმნაში არა მხოლოდ ცალკეული ქართველი მეცნიერები, არამედ ქართული კვლევითი და საგანმანათლებლო ინსტიტუციებიც არიან ჩართული. 1999 წლიდან 2012 წლამდე 8 ჯგუფური საერთაშორისო სამეცნიერო პროექტი და 7 ქართველი მეცნიერის ინდივიდუალური პროექტი განხორციელდა იოსტ გიპერტისა და მანანა თანდაშვილის ხელმძღვანელობით, რომლის საერთო ღირებულება 1, 5 მილიონ ევროს შეადგენს:

  1. არმაზი - კავკასიური ენები და კულტურები - 1999-2002
  2. ECLinG - საფრთხეში მყოფი კავკასიური ენები საქართველოში - 2002-2005
  3. კავკასიოლოგთა საერთაშორისო სამეცნიერო კონფერენცია "სოციოლინგვისტური სიტუაცია თანამედროვე საქართველოში", 12-14 დეკემბერი, 2003 წ. ფრანკფურტი
  4. კავკასიური წარმოშობის პალიმფსესტები - 2004-2006
  5. სოციოლინგვისტური სიტუაცია თანამედროვე საქართველოში - 2005-2007
  6. მათესა და მარკოზის სახარების ხელნაწერთა კრიტიკული გამოცემა - 2006-2009
  7. ქართული პალიმფსესტური ხელნაწერები - 2009-2012
  8. ფოლკსვაგენის ფონდის პროგრამის "ევროპასა და აზიას შორის - შუა აზია და კავკასია მეცნიერების ფოკუსში" შემაჯამებელი საერთაშორისო კონფერენცია, 18-21 მაისი 2010 წ. თბილისი
MPI-ANNEX Interface

აღნიშნული პროექტების განხორციელებაში მონაწილეობას იღებდა 200-ზე მეტი ქართველი მეცნიერი და ახალგაზრდა თაობის წარმომადგენელი საქართველოს სხვადასხვა კვლევითი და სასწავლო დაწესებულებებიდან. მათ შორის იყვნენ მზ. შანიძე, თ. გამყრელიძე, ზ. ალექსიძე, ზ. სარჯველაძე, ვ. იმნაიშვილი, დ. მელიქიშვილი, თ. უთურგაიძე, ი. ჩანტლაძე, გ. გოგოლაშვილი, დ. თვალთვაძე, ა. ხარანაული, ქ. დათუკიშვილი, ნ. ჭუმბურიძე, ნ. ლოლაძე, მ. ბაბუხადია, ნ. დობორჯგინიძე, მ. მაჩხანელი, ნ. შარაშენიძე, კ. გაბუნია, ჭ. ქირია, ლ. ეზუგბაია, რ. ქურდაძე, მ. მანჯგალაძე, მ. საღლიანი, რ. იოსელიანი, ქ. მარგიანი, ე. გიუნაშვილი, მ. მაჩხანელი, ტ. სიხარულიძე, რ. აბაშია, ლ. ქაროსანიძე, თ. ლომთაძე, დ. ჩიტუნაშვილი, თ. აბაშიძე, ხ. თოდუა, ბ. თოფურია, ვ. კვანტრიშვილი, გ. ალექსიძე, გ. შაბაშვილი, ლ. ციხელაშვილი, ნ. დანელია და სხვ. ქართული ენის კორპუსის შექმნის მეორე ეტაპზე კორპუსი საგრძნობლად განივრცო გაციფრებული რესურსებით, ძველი და საშუალი ქართულის ორიგინალური და ნათარგმნი ძეგლებით, როგორიცაა გრაცის ხანმეტი ლექციონარი (ი. გიპერტი, ვ. იმნაიშვილი, ზ.სარჯველაძე), ხანმეტი პალიმფსესტი A89 / A844 (ლ. ქაჯაია, ი. გიპერტი), ვენის ხანმეტი პალიმფსესტი[მკვდარი ბმული] (ი. გიპერტი, ზ. სარჯველაძე, ლ. ქაჯაია), სახარების ადიშის რედაქცია (ი. გიპერტი, ვ. იმნაიშვილი, ზ. სარჯველაძე, ს. სარჯველაძე, დ.თვალთვაძე), მცხეთის ბიბლია (ი. გიპერტი, ა. ხარანაული, ქ. დათუკიშვილი, ნ. ლოლაძე, ს. სარჯველაძე, დ. თვალთვაძე, ნ. ჭუმბურიძე), http://titus.uni-frankfurt.de/texte/etcs/cauc/ageo/nt/pavlecd/pavle.htm პავლენი[მკვდარი ბმული] (ი. გიპერტი, ვ. იმნაიშვილი, ს. სარჯველაძე, დ. თვალთვაძე), საქმენი მოციქულთანი (ი. გიპერტი, ვ. იმნაიშვილი), კათოლიკეთა ეპისტოლენი (ი. გიპერტი, ვ. იმნაიშვილი), იოანეს გამოცხადება (ი. გიპერტი, ვ. იმნაიშვილი), ქებათა ქება - G რედაქცია (ზ. სარჯველაძე) პეიკოპები ძველი და ახალი აღთქმიდან (ი. გიპერი, ს. სარჯველაძე, დ. თვალთვაძე), შოთა რუსთაველი, ვეფხისტყაოსანი (ი. გიპერტი, ვ. იმნაიშვილი), ვისრამიანი (ი. გიპერტი, თ. აბაშიძე, ხ. თოდუა), არჩილიანი (მეფე არჩილისი სხვა პოეტური ტექსტები) (პ. ოლივიერი, ი. გიპერტი, ა. მეფისაშვილი), ჩახრუხაძე, თამარიანი (ი. გიპერტი, ვ. იმნაიშვილი), შავთელი, აბდულმესიანი (ი. გიპერტი, ვ. იმნაიშვილი), მოსე ხონელი, ამირანდარეჯანიანი (ი. გიპერტი, ნ. ჭუმბურიძე) და სხვ.

ქართული ენის კორპუსის შექმნაში მონაწილეობდნენ საქართველოს სხვადასხვა სამეცნიერო-კვლევითი და საგანმანათლებლო ინსტიტუციები საქართველოს ყველა რეგიონიდან, მათ შორის სამეცნიერო აკადემიები, უნივერსიტეტები, კვლევითი ინსტიტუტები და მუზეუმები:

  1. ივანე ჯავახიშვილის სახელობის თბილისის სახელმწიფო უნივერსიტეტის ძველი ქართული ენის კათედრა
  2. თსუ სამეცნიერო ლაბორატორია „ორიონი“
  3. თსუ სტრუქტურული და გამოყენებითი ლინგვისტიკის კათედრა
  4. არნოლდ ჩიქობავას სახელობის ენათმეცნიერების ინსტიტუტი
  5. სულხან/საბას პედაგოგიური უნივერსიტეტი
  6. ილიას სახელმწიფო უნივერსიტეტი
  7. საქართველოს ტექნიკური უნივერსიტეტი
  8. შოთა რუსთაველის სახელობის ბათუმის სახელმწიფო უნივერსიტეტი
  9. აკაკი წერეთლის სახელობის ქუთაისის სახელმწიფო უნივერსიტეტი
  10. საქართველოს მეცნიერებათა აკადემია
  11. შოთა რუსთაველის სახელმწიფო კომისია
  12. გელათის მეცნიერებათა აკადემია
  13. კ. კეკელიძის სახელობის ხელნაწერთა ინსტიტუტი
  14. გ. წერეთლის სახელობის აღმოსავლეთმცოდნეობის ინსტიტუტი
  15. საქართველოს პარლამენტის ეროვნული ბიბლიოთეკა
  16. ეროვნული სამეცნიერო ბიბლიოთეკა
  17. საქართველოს ეროვნული მუზეუმი

1984-2012 წლებში იოსტ გიპერტის ხელმძღვანელობით და ქართველი მეცნიერების აქტიური მონაწილეობით თავი მოეყარა ქართული ენის ისტორიული არსებობის განმავლობაში შექმნილ უზარმაზარ კორპუსს - უძველესი წარწერებიდან მოყოლებული ბესიკის ჩათვლით - და მოიცავს V-XVIII საუკუნეების ქართული დამწერლობის უმნიშვნელოვანეს ძეგლებს, მათ შორის უცხოეთის ბიბლიოთეკებში, უნივერსიტეტებსა და მონასტრებში დაცულ პალიმფსესტურ ხელნაწერებს.

ქართული ენის ეროვნული კორპუსის შექმნის ისტორია და საფუძვლები[რედაქტირება | წყაროს რედაქტირება]

GEKKO-Corcordance

ქართული ენის ეროვნული კორპუსის შექმნა დაიწყო 2012 წელს, როდესაც ფოლკსვაგენის ფონდმა დააფინანსა იოსტ გიპერტისა და მანანა თანდაშვილის მიერ წარდგენილი საერთაშორისო სამეცნიერო პროექტი „ქართული ენის ეროვნული კორპუსი: ტექნოლოგიური ჩარჩოს შექმნა“ (2012-2014). ქართული ენის ეროვნული კორპუსის ელექტრონული რესურსების საფუძველს წარმოადგენდა ის ელექტრონული რესურსების ნაკრები, რომელიც იქმნებოდა სამეცნიერო პროექტების სახით ფრანკფურტის გოეთეს სახ. უნივერსიტეტის ემპირიული ენათმეცნიერების ინსტიტუტში გერმანელ და ქართველ მეცნიერთა მონაწილეობით და განთავსებული იყო გერმანიაში (TITUS-სა და ARMAZI-ს ქართული რესურსები), ნორვეგიაში (Clarino), ჰოლანდიასა (Max Plank Institute, Language Archive) და საქართველოში (დიალექტური კორპუსი, Opentext, lib.ge).

ქართული დიალექტური კორპუსი

ამდენად, ქართული ენის ეროვნული კორპუსი ეყრდნობა დიგიტალურ რესურსებს, რომელიც გასული საუკუნის 80-იანი წლებიდან იქმნებოდა საქართველოსა და მის ფარგლებს გარეთ და მოიცავს როგორც წერილობით, ისე ზეპირმეტყველების წერილობით დოკუმენტირებულ და გაციფრებულ რესურსებს:

  • TITUS-ის ქართული რესურსები (გერმანია, ფრანკფურტის უნივერსიტეტი, პროექტის ხელმძღვანელი იოსტ გიპერტი), რომელიც მოიცავს ძველი და საშუალი ქართულის ორიგინალურ და ნათარგმნ ძეგლებს.
  • კავკასიური ენების ელექტრონული პორტალის ARMAZI-ს ქართული რესურსები (გერმანია, ფრანკფურტის უნივერსიტეტი, პროექტის ხელმძღვანელები: იოსტ გიპერტი და მანანა თანდაშვილი), რომელშიც შესულია 1999-2008 წლებში გაციფრებული რესურსები ძველი, საშუალი და ახალი ქართულიდან.
  • სამეცნიერო პროექტები ECLinG (საფრთხეში მყოფი კავკასიური ენები საქართველოში) და SSGG (სოციოლინგვისტური სიტუაცია თანამედროვე საქართველოში) ფარგლებში ჩაწერილი ქართული ენის ზეპირმეტყველების აუდიო-ვიდეო მასალები, რომელიც ინახება ჰოლანდიაში, ნეიმეხენის მაქს პლანკის ინსტიტუტის ენის დიგიტალურ არქივში (გერმანია, ფრანკფურტის უნივერსიტეტი, პროექტის ხელმძღვანელები: იოსტ გიპერტი და მანანა თანდაშვილი).
  • ქართული დიალექტური კორპუსის (GDC) რესურსები (საქართველო, არნ. ჩიქობავას სახ. ენათმეცნიერების ინსტიტუტი, ხელმძღვანელი: მარინე ბერიძე), რომელიც სამეცნიერო პროექტების განხორციელების შედეგად იქმნებოდა და ფინანსდებოდა ღია საზოგადოება საქართველოსა და რუსთაველის მეცნიერების განვითარების ეროვნული ფონდის მიერ. აღნიშნული კორპუსი წარმოადგენს ქართული ენის ზეპირმეტყველების კორპუსს და მოიცავს უნიკალურ ეთნოლინგვისტურ მასალას. მასში შესულია როგორც არნ. ჩიქობავას სახ. ენათმეცნიერების არქივში დაცული დიალექტური ექსპედიციების მასალების გაციფრებული ვერსიები, ისე საქართველოში გავრცელებული თანამედროვე დიალექტური მეტყველება და ისტორიული დიასპორების ზეპირმეტყველების უნიკალური ნიმუშები.
  • GEKKO-ს რესურსები (ნორვეგია, ავტორი პაულ მოირერი);
  • ქართული პრესის ელექტრონული არქივი Opentext (ავტორი ირაკლი იაკობაშვილი) - პირველი პრესის კორპუსი, რომელიც შეიქმნა საქართველოში და აერთიანებს პოსტსაბჭოთა პრესის დიგიტალურ მასალებს.
  • ღია ელექტრონული რესურსი lib.ge (ავტორი გიორგი კეკელიძე), თავისუფალი რესურსი, რომელშიც შესულია XIX-XX საუკუნეების ქართული ლიტერატურული და პუბლიცისტური მემკვიდრეობა.

ქართული ენის ეროვნული კორპუსის მოცულობა[რედაქტირება | წყაროს რედაქტირება]

ქართული ენის ეროვნული კორპუსი დღევანდელი მონაცემების მიხედვით 130 მილიონი ტოკენის, ანუ სიტყვაფორმის მომცველია (შდრ. ბრიტანული ეროვნული კორპუსი - 100 მილიონი ტოკენი, სომხური ეროვნული კორპუსი - 110 მილიონი ტოკენი, რუსული ეროვნული კორპუსი - 150 მილიონი ტოკენი). მასში შესულია როგორც ქართული ენის ისტორიული მემკვიდრეობა (V-XVIII საუკუნეების ლიტერატურული და ისტორიული ძეგლები), ისე XIX-XX საუკუნეების ქართული ლიტერატურა და 90-იანი წლებიდან მოყოლებული ქართული პრესა. ამჟამად მიმდინარეობს ქართული ენის კორპუსის XIX და XX საუკუნეების პრესის მასალებით განვრცობა. კორპუსის შექმნის არსებით მიზანს წარმოადგენს კორპუსის ჟანრობრივი დაბალანსება, კერძოდ სამეცნიერო, იურიდიული, პოლიტიკური და სოციოლექტური მასალებით მისი გაჯერება.

ქართული ენის ეროვნული კორპუსის ეტაპობრივი განვითარება[რედაქტირება | წყაროს რედაქტირება]

2013 წლის 29 სექტემბერს ხელი მოეწერა ურთიერთთანამშრომლობის მემორანდუმს ფრანკფურტის გოეთეს სახ. უნივერსიტეტის ემპირიული ენათმეცნიერების ინსტიტუტსა და საქართველოს პარლამენტის ეროვნულ ბიბლიოთეკას შორის, რომელიც ითვალისწინებს ფრანკფურტის უნივერსიტეტში განთავსებული ქართული ენის ეროვნული კორპუსის საქართველოში გადმოტანას და გრძელვადიან თანამშრომლობას ქართული ენის ეროვნული კორპუსის შემდგომი განვითარების მიზნით. ქართული ენის ეროვნული კორპუსის განვითარების შესახებ თანამშრომლობა სამი ეტაპისგან შედგება:

I. ეტაპი: ქართული ენის ეროვნული კორპუსის ტექნოლოგიური ჩარჩოს შექმნა - ხანგრძლივობა 2013-2015 წლები[რედაქტირება | წყაროს რედაქტირება]

  1. ქართული ენისათვის არსებული ელექტრონული რესურსების ინტეგრაცია ქართული ენის ეროვნულ კორპუსში და მისი გაერთმნიშვნელიანება.
  2. ანოტაციისა და კორპუსის სტრუქტურის ვალიდურობის შუალედური ევალუაცია;
  3. პარალელური კორპუსებისა და თარგმნილი ტექსტების ჯვარედინი რეფერენციის სისტემების განვითარება;
  4. საძიებო სისტემის KRIC-პრინციპების შემუშავება და აპრობაცია;
  5. საძიებო სისტემის განვითარება სინქრონული და დიაქრონული კვლევების განსახორციელებლად;
  6. კორპუსის ანოტირების საშუალებების (tools) განვითარება
  7. ტექსტების ანოტირება:
  • ტექსტების მეტამონაცემებით აღჭურვა - კორპუსის შემადგენელ თითოეულ ტექსტზე საერთაშორისო სტანდარტების (TEI - Text Encoding Initiative)მიხედვით განსაზღვრული მეტამონაცემების მიმაგრება კორპუსში ინტერდისციპლინარული კვლევის განხორციელების მიზნით;
  • ტექსტის მარკირების საგანგებო ნიშნულების სისტემით აღჭურვა (textual markup);
  • ტექსტების ლინგვისტური ანოტაციის პრინციპების შემუშავება ანოტაციის დონეების მიხედვით;
  • გრამატიკულ მახასიათებელთა სისტემატიზაცია;

II. ეტაპი: ოქროს სტანდარტის (პროტოტიპული) კორპუსის შექმნა - ხანგრძლივობა 2015-2018 წლები[რედაქტირება | წყაროს რედაქტირება]

  1. ოქროს სტანდარტის ვალიდურობის შუალედური ევალუაცია და სტანდარტის დახვეწა;
  2. ქართული ენის კორპუსის ბალანსირების სტრატეგიის შემუშავება;
  3. ქართული ენის ეროვნული კორპუსის რეფერენციალური შეპირისპირება პარალელურ კორპუსებთან;
  4. კორპუსის განვრცობისა და ბალანსირების საშუალებების (tools) განვითარება;
  5. ქართული ენის ეროვნული კორპუსის, როგორც ღია კორპუსის, განვითარების ნორმების დადგენა.
  6. ოქროს სტანდარტის კორპუსის დამუშავება:
  • ოქროს სტანდარტის კორპუსის მოცულობის განსაზღვრა,
  • ჟანრობრივი მრავალფეროვნების განსაზღვრა ოქროს სტანდარტის კორპუსში,
  • თვისობრივი მახასიათებლების დადგენა და კორპუსის დამუშავების ხარისხის განსაზღვრა,
  • დისამბიგვირება;

III. ეტაპი: კორპუსის ბალანსირება - ხანგრძლივობა 2018-2023 წლები[რედაქტირება | წყაროს რედაქტირება]

  1. ოქროს სტანდარტის ვალიდურობის საბოლოო ევალუაცია;
  2. ოქროს სტანდარტის დადგენილი ნორმების განხორციელება მთლიან კორპუსზე;
  3. კორპუსის დადგენილი ნორმების მიხედვით ბალანსირება;
  4. კორპუსის ბალანსირების შუალედური ევალუაცია;
  5. კორპუსის შემდგომი განვრცობის ნორმალიზაცია;
  6. ქართული ენის ეროვნული კორპუსის, როგორც ღია კორპუსის, ექსპლუატაცია.

ქართული ენის ეროვნული კორპუსის განვითარების ხელმძღვანელობა[რედაქტირება | წყაროს რედაქტირება]

ქართული ენის ეროვნული კორპუსის კონცეფცია და განვითარების გეგმა შედგენილია კორპუსის დირექტორიუმის მიერ, რომელშიც შედიან:

  1. პროფ. იოსტ გიპერტი, ფრანკფურტი
  2. პროფ. მანანა თანდაშვილი, ფრანკფურტი
  3. პროფ. მარინე ბერიძე, თბილისი
  4. ირაკლი ღარიბაშვილი, თბილისი
  5. გიორგი კეკელიძე, თბილისი

ქართული ენის ეროვნული კორპუსის მნიშვნელობა[რედაქტირება | წყაროს რედაქტირება]

ქართული ენის ეროვნული კორპუსის შექმნას აქვს როგორც სახელმწიფოებრივი, ისე სამეცნიერო და საზოგადოებრივი მნიშვნელობა.

  1. ქართული ენის ეროვნული კორპუსის შექმნით პრაქტიკულად საფუძველი ეყრება ენის, როგორც ისტორიული მემკვიდრეობის თანამედროვე ტექნოლოგიებით აღჭურვილი „საცავის“ შექმნას - ქართული ენის ეროვნული კორპუსი გააერთიანებს ქართული ენის ისტორიული არსებობის განმავლობაში შექმნილ ძველი,საშუალი და ახალი ქართულის წერილობით ძეგლებსა და უახლესი ქართული ენის წერილობით და ზეპირმეტყველების ნიმუშებს.
  2. ქართული ენის ეროვნული კორპუსის შექმნა ხელს შეუწყობს ქართული ენის თანამედროვე ტექნოლოგიური საშუალებებით კვლევას და შესაბამისად მეცნიერების კონკრეტული დარგის, ქართველოლოგიის შემდგომ განვითარებას, თუმცა იგი, უპირველეს ყოვლისა, ინტერდისციპლინარული კვლევების განსახორციელებლად აუცილებელი რესურსია.
  3. გარდა სამეცნიერო მნიშვნელობისა, ქართული ენის ეროვნული კორპუსის შექმნას სახელმწიფოებრივი მნიშვნელობაც გააჩნია როგორიცაა:
  • ქართული ენის ნორმალიზაციისა და სტანდარტიზაციის სახელმწიფო პროგრამა;
  • ქართული ენის ტექნოლოგიზება (სპელჩეკერისა და პარსერის დახვეწა ქართული ენისათვის);
  • ელექტრონული ლექსიკოლოგიის განვითარება და მათი საყოველთაო გამოყენების უზრუნველოყოფა;
  • ქართული ენის, როგორც სახელმწიფო ენის სწავლების ელექტრონული პროგრამების შექმნა და დანერგვა საშუალო სკოლებსა და უმაღლეს სასწავლებლებში;
  • eLearning-ის გაქართულება - ქართული ენის ადაპტაცია ელექტრონული სწავლების პლატფორმებისათვის.

რესურსები ინტერნეტში[რედაქტირება | წყაროს რედაქტირება]