კურსის შესახებ: ანა მამათელაშვილი , ტექსტის დამუშავება, ნაწილი II
15 ლექცია, ხანგრძლივობა: 10 საათი 53 წუთი 40 წამი
კურსის შესახებ
ლექტორის შესახებ
Ანა მამათელაშვილი სამი წელია მუშაობს მონაცემთა მეცნიერების და მანქანური სწავლების დარგში. Ამ დროის განმავლობაში მუშაობდა სხვადასხვა პროექტებზე ელაიზასა და კატერპილარში, მათ შორის ბუნებრივი ენის დამუშავების კუთხით, და ამჟამად არის მანქანური სწავლების მთავარი ინჟინერი ქვანტორიში. Ანა აკადემიურ პროფესიულ წარსულში შეისწავლიდა მათემატიკას, კერძოდ სიმრავლურ ტოპოლოგიას, და ატარებდა კვლევით და საგანმანათლებლო საქმიანობას პიტსბურგის, ობურნის და მელბურნის უნივერსიტეტებში. Ანას აქვს დოქტორის ხარისხი მათემატიკაში პიტსბურგის უნივერსიტეტიდან.
მონაცემების ანალიზისა და ვიზუალიზაციის პრაქტიკული ონლაინ კურსი კვლევაში ჩართულ ყველა დაინტერესებულ პირს სთავაზობს, ღია მეცნიერების პრაქტიკების გათვალისწინებით, მონაცემების ანალიზისა და ვიზუალიზაციის შესწავლას.
რას ისწავლით
როგორ ჩაატაროთ კვლევა ღია მეცნიერების პრაქტიკების გამოყენებით, მათ შორის - მონაცემების მოძიებას, მონაცემების აღწერას და გაზიარებას, სხვებთან კოლაბორაციას, კვლევის პრერეგისტრაციას და პრეპრინტების გაზიარებას.
R-ის პროგრამირების საფუძვლებს - R-ში მუშაობის ძირითად პრინციპებს.
მონაცემების ანალიზსა და სტატისტიკას, მათ შორის - როგორ ააგოთ მოდელები და მოახდინოთ შედეგების ინტერპრეტაცია.
მონაცემების პუბლიკაციისთვის გამზადებულ ვიზუალიზაციას ggplot2-ისა და სხვა პაკეტების დახმარებით.
ანალიზის შედეგად რეპორტების მომზადებას.
სწავლების მეთოდები
კურსის მთავარი სწავლების მეთოდი ვიდეოლექციებია. ლექციები მოიცავს პრაქტიკულ სავარჯიშოებს, რომლებიც საიტზეა განთავსებული. სტუდენტს შეუძლია ლექციის პარალელურად სავარჯიშოები მოამზადოს.
ამ ვიდეოში განვაგრძობთ ტექსტთან მუშაობის მეთოდების განხილვას. Მიმოვიხილავთ ტექსტის ანალიზის სახეობებს, მაგალითად, სენტიმენტის ანალიზს, ვიზუალიზაციებს. Გავეცნობით spacyr სისტემას, რომელიც გვაძლევს წვდომას ენის მოდელზე დაფუძნებულ ანალიტიკურ ფუნქციებზე, მაგალითად, გრამატიკული ელემენტების და მიმართებების გამოყოფაზე და სიტყვათა ვექტორებზე.
სენტიმენტის ანალიზი
Wordcloud
spacyr