კურსის შესახებ: ანა მამათელაშვილი , Მოდელირება, ნაწილი II
15 ლექცია, ხანგრძლივობა: 10 საათი 53 წუთი 40 წამი
კურსის შესახებ
ლექტორის შესახებ
Ანა მამათელაშვილი სამი წელია მუშაობს მონაცემთა მეცნიერების და მანქანური სწავლების დარგში. Ამ დროის განმავლობაში მუშაობდა სხვადასხვა პროექტებზე ელაიზასა და კატერპილარში, მათ შორის ბუნებრივი ენის დამუშავების კუთხით, და ამჟამად არის მანქანური სწავლების მთავარი ინჟინერი ქვანტორიში. Ანა აკადემიურ პროფესიულ წარსულში შეისწავლიდა მათემატიკას, კერძოდ სიმრავლურ ტოპოლოგიას, და ატარებდა კვლევით და საგანმანათლებლო საქმიანობას პიტსბურგის, ობურნის და მელბურნის უნივერსიტეტებში. Ანას აქვს დოქტორის ხარისხი მათემატიკაში პიტსბურგის უნივერსიტეტიდან.
მონაცემების ანალიზისა და ვიზუალიზაციის პრაქტიკული ონლაინ კურსი კვლევაში ჩართულ ყველა დაინტერესებულ პირს სთავაზობს, ღია მეცნიერების პრაქტიკების გათვალისწინებით, მონაცემების ანალიზისა და ვიზუალიზაციის შესწავლას.
რას ისწავლით
როგორ ჩაატაროთ კვლევა ღია მეცნიერების პრაქტიკების გამოყენებით, მათ შორის - მონაცემების მოძიებას, მონაცემების აღწერას და გაზიარებას, სხვებთან კოლაბორაციას, კვლევის პრერეგისტრაციას და პრეპრინტების გაზიარებას.
R-ის პროგრამირების საფუძვლებს - R-ში მუშაობის ძირითად პრინციპებს.
მონაცემების ანალიზსა და სტატისტიკას, მათ შორის - როგორ ააგოთ მოდელები და მოახდინოთ შედეგების ინტერპრეტაცია.
მონაცემების პუბლიკაციისთვის გამზადებულ ვიზუალიზაციას ggplot2-ისა და სხვა პაკეტების დახმარებით.
ანალიზის შედეგად რეპორტების მომზადებას.
სწავლების მეთოდები
კურსის მთავარი სწავლების მეთოდი ვიდეოლექციებია. ლექციები მოიცავს პრაქტიკულ სავარჯიშოებს, რომლებიც საიტზეა განთავსებული. სტუდენტს შეუძლია ლექციის პარალელურად სავარჯიშოები მოამზადოს.
Წინა ვიდეოში განხილული მოდელირების მეთოდები ეხებოდა უწყვეტ და დისკრეტულ რიცხვით ცვლადებს. Ამ ვიდეოში განვიხილავთ კატეგორიულ დამოუკიდებელ და დამოკიდებულ ცვლადებს და მათთან მუშაობის მეთოდებს. Დამოუკიდებელი კატეგორიული ცვლადის შემთხვევაში გავეცნობით ცვლადის კოდირებას რიცხვით სივრცეში და ასევე სტატისტიკურ მეთოდებს, t-test და ANOVAს. Კატეგორიული დამოკიდებული ცვლადის შემთხვევაში გავეცნობით კლასიფიკაციის ამოცანას და მოდელირების კლასიკურ მეთოდს, ლოგისტიკურ რეგრესიას.
კატეგორიული ცვლადები
როცა კატეგორიული ცვლადი დამოუკიდებელია – კოდირება
როცა კატეგორიული ცვლადი დამოკიდებულია – კლასიფიცაკია, ლოგისტიკური რეგრესია
t-test
ANOVA