График рассеяния с помощью библиотеки Matplotlib
Scatter - это один из графических типов диаграмм, используемый для отображения связи между двумя переменными. Он представляет собой набор точек, разбросанных на координатной плоскости в соответствии с значениями двух переменных. Основное назначение диаграммы scatter - визуализация взаимосвязи между двумя непрерывными переменными. Визуальное представление точек позволяет определить наличие или отсутствие зависимости или корреляции между переменными.
Для создания scatter plot в Python часто используется библиотека Matplotlib. Matplotlib - это мощный инструмент для визуализации данных, который предоставляет большие возможности для создания различных типов графиков. Scatter plot - один из наиболее распространенных типов графиков, создаваемых с использованием Matplotlib.
Для начала работы с Matplotlib необходимо установить его на компьютер. Установка Matplotlib возможна с помощью менеджера пакетов pip, который входит в стандартный набор инструментов Python. Следующая команда в консоли установит Matplotlib:
pip install matplotlib
После успешной установки Matplotlib можно импортировать в свой Python-скрипт следующим образом:
import matplotlib.pyplot as plt
После импорта можно начать создавать scatter plot. Для создания scatter plot в Matplotlib применяется функция scatter(). Зададим несколько примеров кода, которые демонстрируют создание scatter plot с различными настройками.
- Простой scatter plot:
- Scatter plot с настройками:
<pre><code><span class="hljs-keyword">import</span> matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [10, 12, 15, 18, 20]
plt.scatter(x, y)
plt.show()
</code></pre>
В данном примере массив x содержит значения по оси X, а массив y содержит значения по оси Y. Функция scatter() позволяет передать эти массивы в качестве аргументов и построить scatter plot. Функция show() выводит график на экран.
<pre><code><span class="hljs-keyword">import</span> matplotlib.pyplot as plt
import</span> random
x = [random.randint(0, 10) for _ in range(50)]
y = [random.randint(0, 10) for _ in range(50)]
colors = [random.choice(['r', 'g', 'b']) for _ in range(50)]
sizes = [random.randint(10, 100) for _ in range(50)]
plt.scatter(x, y, c=colors, s=sizes, alpha=0.5)
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Scatter plot')
plt.show()
</code></pre>
В данном примере используется модуль random для генерации случайных данных. Массивы x и y содержат случайные значения по осям X и Y. Массив colors содержит случайно выбранные цвета, которые применяются к каждой точке. Массив sizes содержит случайные значения размеров точек. Функция scatter() принимает аргументы c и s, которые задают цвета и размеры точек соответственно. Функции xlabel(), ylabel() и title() используются для задания подписей осей и заголовка графика.
Таким образом, scatter plot в Matplotlib является мощным инструментом для визуализации взаимосвязи между двумя переменными. Библиотека Matplotlib предоставляет широкий набор возможностей для настройки scatter plot с помощью различных параметров функции scatter(). Это позволяет создавать графики с различными цветами, размерами точек и другими настройками, в зависимости от нужд пользователя.