კურსის შესახებ: ანა მამათელაშვილი , Მონაცემთა დამუშავება
15 ლექცია, ხანგრძლივობა: 10 საათი 53 წუთი 40 წამი
კურსის შესახებ
ლექტორის შესახებ
Ანა მამათელაშვილი სამი წელია მუშაობს მონაცემთა მეცნიერების და მანქანური სწავლების დარგში. Ამ დროის განმავლობაში მუშაობდა სხვადასხვა პროექტებზე ელაიზასა და კატერპილარში, მათ შორის ბუნებრივი ენის დამუშავების კუთხით, და ამჟამად არის მანქანური სწავლების მთავარი ინჟინერი ქვანტორიში. Ანა აკადემიურ პროფესიულ წარსულში შეისწავლიდა მათემატიკას, კერძოდ სიმრავლურ ტოპოლოგიას, და ატარებდა კვლევით და საგანმანათლებლო საქმიანობას პიტსბურგის, ობურნის და მელბურნის უნივერსიტეტებში. Ანას აქვს დოქტორის ხარისხი მათემატიკაში პიტსბურგის უნივერსიტეტიდან.
მონაცემების ანალიზისა და ვიზუალიზაციის პრაქტიკული ონლაინ კურსი კვლევაში ჩართულ ყველა დაინტერესებულ პირს სთავაზობს, ღია მეცნიერების პრაქტიკების გათვალისწინებით, მონაცემების ანალიზისა და ვიზუალიზაციის შესწავლას.
რას ისწავლით
როგორ ჩაატაროთ კვლევა ღია მეცნიერების პრაქტიკების გამოყენებით, მათ შორის - მონაცემების მოძიებას, მონაცემების აღწერას და გაზიარებას, სხვებთან კოლაბორაციას, კვლევის პრერეგისტრაციას და პრეპრინტების გაზიარებას.
R-ის პროგრამირების საფუძვლებს - R-ში მუშაობის ძირითად პრინციპებს.
მონაცემების ანალიზსა და სტატისტიკას, მათ შორის - როგორ ააგოთ მოდელები და მოახდინოთ შედეგების ინტერპრეტაცია.
მონაცემების პუბლიკაციისთვის გამზადებულ ვიზუალიზაციას ggplot2-ისა და სხვა პაკეტების დახმარებით.
ანალიზის შედეგად რეპორტების მომზადებას.
სწავლების მეთოდები
კურსის მთავარი სწავლების მეთოდი ვიდეოლექციებია. ლექციები მოიცავს პრაქტიკულ სავარჯიშოებს, რომლებიც საიტზეა განთავსებული. სტუდენტს შეუძლია ლექციის პარალელურად სავარჯიშოები მოამზადოს.
Ამ ვიდეოში განვიხილავთ მონაცემთა დამუშავების მთავარ პრინციპებს და სასარგებლო ფუნქციების არსენალს. გადავხედავთ ფუნქციებს მონაცემთა ცხრილების შეჯამებისთვის, ვიზუალურად და სტატისტიკურად. Ვისაუბრებთ არასრული მონაცემების პრობლემაზე, ტიპებზე და შევსების მეთოდებზე. Ასევე განვიხილავთ ფუნქციების ორ ჯგუფს, ვექტორიზაციის ფუნქციებს apply ოჯახიდან რომლებიც გამოიყენება ციკლების ნაცვლად და საგრძნობლად ამცირებს გამოთვლით დროს და dplyr პაკეტის ფუნქციებს მონაცემთა ცხრილის მანიპულაციებისთვის
შემაჯამებელი სტატისტიკა
არასრული მონაცემები
apply ფუნქციები
dplyr ფუნქციები მონაცემთა ცხრილის მანიპულაციებისთვის