Volcano диаграмма (статистика)
В статистике, volcano plot является разновидностью точечной диаграммы, которую используют для быстрого обнаружения изменений в больших наборах данных, состоящих из повторяющихся значений. По оси Y указывают статистическую значимость, по X - диапазон различия. Volcano диаграмма популярна в омиксах, таких как геномика, протеомика и метаболомика, где часто используются повторяемые значения и требуется быстро идентифицировать значимые различия. Volcano диаграмма комбинирует измерение статистической значимости (p-value) и диапазона различий, позволяя быстро идентифицировать визуально эти значения (гены и др.) посредством большого диапазона различий со статистически значимыми показателями.
Volcano диаграмми состоит из отрицательного логарифма статистически значимого различия на Y оси (обычно по основанию 10). Эти точки на диаграмме с низким значением P-value стремятся вверх. Ось-X - логарифм различий между двумя значениями. Логарифм различий показывает отличия равноудалённо в оба направления от центра. Формируя диаграмму указанным способом результаты в двух интересующих регионах диаграммы: точки обнаруженные в верхней части диаграммы и далеко расположенные друг от друга. Диаграмма представляет значения, показывающие огромный разброс диапазона различий (слева или справа от центра) и статистическую значимость (увеличивающуюся к верху)
Дополнительная информация может быть добавленна посредством окрашивания точек в соответствии с третьим измерением данных (как пример, интенсивность сигнала). Данная диаграмма также используется в графическом отображении анализа значимости микрочипов
Идея volcano диаграммы может быть обобщена для приложения к другим измерениям, где ось-X соответствует измерению силы статистического сигнала, а ось-Y соответствует измерению статистической значимости сигнала. Например, в генетических ассоциациях контрольная группа, такая как полногеномный поиск ассоциаций, на диаграмме точка представляет однонуклеотидный полиморфизм. Значение по оси-X может быть диапазоном изменения, по оси-Y может быть -log10 p-значения из хи-квадрата.[1]