1. Области применения
    1. максимизировать понимание данных
      1. насколько данные хороши
      2. посмотреть насколько данные качественные
      3. найти все метаданные
    2. вычленять наиболее важные переменные для анализа
      1. на основе полученных данных (графики) получить гипотезы, предположение о распределении данных
    3. обранаружить выбросы и аномалии
  2. Инструменты
    1. Построение данных
      1. Boxplot
        1. понять насколько распределение нормальное
          1. найти выбросы
      2. гистограммы
      3. qq-plot
      4. зависимость одной величины от другой
        1. матрица корреляции
      5. ===>
        1. ответ на вопросы
        2. гипотезы
        3. направление развития
        4. Распределение
          1. характер распределения и выявить скрытые паттерны данных
          2. оставляем сырые данные, не только проценты
    2. Численные показатели
    3. Описательная статистика
      1. мин
      2. мах
      3. медиана
      4. верхний квартиль или третий квартиль
      5. максимум выборки
  3. Что делать с NA
    1. Шаг 1
      1. проверить, что данные были собраны нормально
    2. Шаг 2
      1. убрать наблюдения с отсуствующими значением
    3. Шаг 3
      1. убрать признаки с большим кол-вом NA
    4. Шаг 4
      1. заменить среднее на медиану или моду
    5. Шаг 5
      1. множественная замена
    6. ....
  4. tools
    1. CLT for means
      1. https://gallery.shinyapps.io/CLT_mean/
    2. Normal Table - z Table - Standard Normal Table - Normal Distribution Table
      1. http://www.normaltable.com/ztable-righttailed.html
    3. Distribution Calculator
      1. https://gallery.shinyapps.io/dist_calc/
    4. Sample Size Calculator (Evan’s Awesome A/B Tools)
      1. https://www.evanmiller.org/ab-testing/sample-size.html
    5. jypyter notebook
      1. Jupyter Notebook для начинающих: учебник - Еще один блог веб разработчика
        1. https://webdevblog.ru/jupyter-notebook-dlya-nachinajushhih-uchebnik/
    6. Values of the t-distribution (two-tailed)
      1. https://www.medcalc.org/manual/t-distribution.php
    7. Understanding and Interpreting Correlations - an Interactive Visualization
      1. https://rpsychologist.com/d3/correlation/
    8. Diagnostics for simple linear regression
      1. https://gallery.shinyapps.io/slr_diag/
  5. My .ipynb
    1. https://gist.github.com/DaryaManuhina/111d1d2d94774fe6d7c140ffdfa00a43
  6. Sources
    1. Основы Python. Работа с библиотекой Pandas
      1. https://www.youtube.com/watch?v=FXZa1qgiHMI&feature=youtu.be&fbclid=IwAR18nL6LUkHHp3j2Uhprvs_2jOp09rfA-YwGWm_-5NJhwwllVmmqH-uG79Q
    2. pandas-profiling
      1. https://github.com/pandas-profiling/pandas-profiling
    3. The Ultimate Guide to the Pandas Library for Data Science in Python
      1. https://www.freecodecamp.org/news/the-ultimate-guide-to-the-pandas-library-for-data-science-in-python/
    4. Pandas Project: Make a Gradebook With Python & Pandas
      1. https://realpython.com/pandas-project-gradebook/
    5. Exploratory data analysis в Pandas
      1. https://www.youtube.com/watch?v=wKrsanSXzk0&feature=youtu.be
    6. https://pandas.pydata.org/pandas-docs/stable/getting_started/overview.html
    7. A Quick Introduction to the “Pandas” Python Library
      1. https://towardsdatascience.com/a-quick-introduction-to-the-pandas-python-library-f1b678f34673
    8. Введение в pandas: анализ данных на Python
      1. https://khashtamov.com/ru/pandas-introduction/
    9. Python Operators from Scratch!!! — A Beginner’s Guide
      1. https://towardsdatascience.com/python-operators-from-scratch-a-beginners-guide-8471306f4278
  7. понять, откуда пришло это значение