library-icon ტექნოლოგიები

მონაცემების ანალიზი და ვიზუალიზაცია ღია მეცნიერების პრინციპებით

15 ლექცია, ხანგრძლივობა: 10 საათი 53 წუთი 40 წამი
eye

8,072

1 /

კურსის შესახებ: ანა მამათელაშვილი , Მოდელირება, ნაწილი III

15 ლექცია, ხანგრძლივობა: 10 საათი 53 წუთი 40 წამი

კურსის შესახებ

library

ლექტორის შესახებ

ანა მამათელაშვილი


Ანა მამათელაშვილი სამი წელია მუშაობს მონაცემთა მეცნიერების და მანქანური სწავლების დარგში. Ამ დროის განმავლობაში მუშაობდა სხვადასხვა პროექტებზე ელაიზასა და კატერპილარში, მათ შორის ბუნებრივი ენის დამუშავების კუთხით, და ამჟამად არის მანქანური სწავლების მთავარი ინჟინერი ქვანტორიში. Ანა აკადემიურ პროფესიულ წარსულში შეისწავლიდა მათემატიკას, კერძოდ სიმრავლურ ტოპოლოგიას, და ატარებდა კვლევით და საგანმანათლებლო საქმიანობას პიტსბურგის, ობურნის და მელბურნის უნივერსიტეტებში. Ანას აქვს დოქტორის ხარისხი მათემატიკაში პიტსბურგის უნივერსიტეტიდან.

მონაცემების ანალიზისა და ვიზუალიზაციის პრაქტიკული ონლაინ კურსი კვლევაში ჩართულ ყველა დაინტერესებულ პირს სთავაზობს, ღია მეცნიერების პრაქტიკების გათვალისწინებით, მონაცემების ანალიზისა და ვიზუალიზაციის შესწავლას. 

რას ისწავლით

  • როგორ ჩაატაროთ კვლევა ღია მეცნიერების პრაქტიკების გამოყენებით, მათ შორის - მონაცემების მოძიებას, მონაცემების აღწერას და გაზიარებას, სხვებთან კოლაბორაციას, კვლევის პრერეგისტრაციას და პრეპრინტების გაზიარებას. 

  • R-ის პროგრამირების საფუძვლებს - R-ში მუშაობის ძირითად პრინციპებს.

  • მონაცემების ანალიზსა და სტატისტიკას, მათ შორის - როგორ ააგოთ მოდელები და მოახდინოთ შედეგების ინტერპრეტაცია.

  • მონაცემების პუბლიკაციისთვის გამზადებულ ვიზუალიზაციას ggplot2-ისა და სხვა პაკეტების დახმარებით.

  • ანალიზის შედეგად რეპორტების მომზადებას.

სწავლების მეთოდები

კურსის მთავარი სწავლების მეთოდი ვიდეოლექციებია. ლექციები მოიცავს პრაქტიკულ სავარჯიშოებს, რომლებიც საიტზეა განთავსებული. სტუდენტს შეუძლია ლექციის პარალელურად სავარჯიშოები მოამზადოს. 

სასწავლო ლექციები

  1. 26:10
  2. 43:15
  3. 55:54
  4. 31:56
  5. 45:25
  6. 42:21
  7. 43:45
  8. 42:46
  9. 45:28
  10. 45:58
  11. 46:03
  12. 46:03
  13. 48:29
  14. 44:43
  15. 45:24

Ჩვენი კურსის ბოლო ვიდეო დაეთმობა ორ მნიშვნელოვან თემას მონაცემთა მოდელირებაში, ფაქტორების ანალიზს და მრავალდონიან წრფივ რეგრესიას. Გავეცნობით ფაქტორების ანალიზის მთავარ დანიშნულებას, მრავალგანზომილებიანი მონაცემებში რამდენიმე მთავარი მამოძრავებელი ფაქტორის აღმოჩენას და შედეგად მონაცემების მცირე-განზომილებიან სივრცეში გადმოტანას (PCA) და მონაცემთა ცვალებადობისთვის უფრო ნათელი ინტერპრეტაციის მინიჭებას მთავარი ფაატორების იდენტიფიცირებით (Maximum Likelihood). გავეცნობით Მრავალდონიანი მოდელირების გამოყენების საჭიროებას ისეთ შემთხვევებში როდესაც მონაცემთა შეგროვება ხდება რამდენიმე დონეზე (მაგალითად, ინდივიდის დონეზე და ჯგუფურ დონეზე), ასევე მაგალითებს და პაკეტებს. 

  • ფაქტორების ანალიზი

    • PCA

  • Maximum Likelihood

  • Multilevel linear regression