კურსის შესახებ: ანა მამათელაშვილი , მონაცემების მოძიება
15 ლექცია, ხანგრძლივობა: 10 საათი 53 წუთი 40 წამი
კურსის შესახებ
ლექტორის შესახებ
Ანა მამათელაშვილი სამი წელია მუშაობს მონაცემთა მეცნიერების და მანქანური სწავლების დარგში. Ამ დროის განმავლობაში მუშაობდა სხვადასხვა პროექტებზე ელაიზასა და კატერპილარში, მათ შორის ბუნებრივი ენის დამუშავების კუთხით, და ამჟამად არის მანქანური სწავლების მთავარი ინჟინერი ქვანტორიში. Ანა აკადემიურ პროფესიულ წარსულში შეისწავლიდა მათემატიკას, კერძოდ სიმრავლურ ტოპოლოგიას, და ატარებდა კვლევით და საგანმანათლებლო საქმიანობას პიტსბურგის, ობურნის და მელბურნის უნივერსიტეტებში. Ანას აქვს დოქტორის ხარისხი მათემატიკაში პიტსბურგის უნივერსიტეტიდან.
მონაცემების ანალიზისა და ვიზუალიზაციის პრაქტიკული ონლაინ კურსი კვლევაში ჩართულ ყველა დაინტერესებულ პირს სთავაზობს, ღია მეცნიერების პრაქტიკების გათვალისწინებით, მონაცემების ანალიზისა და ვიზუალიზაციის შესწავლას.
რას ისწავლით
როგორ ჩაატაროთ კვლევა ღია მეცნიერების პრაქტიკების გამოყენებით, მათ შორის - მონაცემების მოძიებას, მონაცემების აღწერას და გაზიარებას, სხვებთან კოლაბორაციას, კვლევის პრერეგისტრაციას და პრეპრინტების გაზიარებას.
R-ის პროგრამირების საფუძვლებს - R-ში მუშაობის ძირითად პრინციპებს.
მონაცემების ანალიზსა და სტატისტიკას, მათ შორის - როგორ ააგოთ მოდელები და მოახდინოთ შედეგების ინტერპრეტაცია.
მონაცემების პუბლიკაციისთვის გამზადებულ ვიზუალიზაციას ggplot2-ისა და სხვა პაკეტების დახმარებით.
ანალიზის შედეგად რეპორტების მომზადებას.
სწავლების მეთოდები
კურსის მთავარი სწავლების მეთოდი ვიდეოლექციებია. ლექციები მოიცავს პრაქტიკულ სავარჯიშოებს, რომლებიც საიტზეა განთავსებული. სტუდენტს შეუძლია ლექციის პარალელურად სავარჯიშოები მოამზადოს.
ამ ვიდეოში გადავხედავთ მონაცემთა წყაროებს და მოძიების მეთოდებს. Მიმოვიხილავთ სამ ძირითად ჯგუფს: ღია მონაცემების რეპოზიტორიებს, APIს მეშვეობით ხელმისაწვდომ მონაცემებს და არასტრუქტურირებულ მონაცემებს. Განვიხილავთ მონაცემთა ჩატვირთვის ფუნქციებს და web scrapingის მეთოდით არასტრუქტურირებული მონაცემების შეგროვების მაგალითს.
ღია მონაცემები
მონაცემთა ჩატვირთვა
Twitter API
მონაცემთა მოპოვება ვებსაიტებიდან