Volcano диаграмма (статистика)

В статистике, volcano plot является разновидностью точечной диаграммы, которую используют для быстрого обнаружения изменений в больших наборах данных, состоящих из повторяющихся значений. По оси Y указывают статистическую значимость, по X - диапазон различия. Volcano диаграмма популярна в омиксах, таких как геномика, протеомика и метаболомика, где часто используются повторяемые значения и требуется быстро идентифицировать значимые различия. Volcano диаграмма комбинирует измерение статистической значимости (p-value) и диапазона различий, позволяя быстро идентифицировать визуально эти значения (гены и др.) посредством большого диапазона различий со статистически значимыми показателями.

Volcano plot показывает метаболомные данные. Красные стрелки направлены на точки, показывающие большой диапазон различия (ось x) и высокую статистическую значимость (ось Y - отрицательный логарифм по основанию 10 P-значения - -log10 p value). Пунктирная красная линия указывает p = 0.05, точки выше линии имеют p < 0.05, точки ниже p > 0.05. Серые точки имеют диапазон различия менее чем 2 (log2 = 1).

Volcano диаграмми состоит из отрицательного логарифма статистически значимого различия на Y оси (обычно по основанию 10). Эти точки на диаграмме с низким значением P-value стремятся вверх. Ось-X - логарифм различий между двумя значениями. Логарифм различий показывает отличия равноудалённо в оба направления от центра. Формируя диаграмму указанным способом результаты в двух интересующих регионах диаграммы: точки обнаруженные в верхней части диаграммы и далеко расположенные друг от друга. Диаграмма представляет значения, показывающие огромный разброс диапазона различий (слева или справа от центра) и статистическую значимость (увеличивающуюся к верху)

Дополнительная информация может быть добавленна посредством окрашивания точек в соответствии с третьим измерением данных (как пример, интенсивность сигнала). Данная диаграмма также используется в графическом отображении анализа значимости микрочипов

Идея volcano диаграммы может быть обобщена для приложения к другим измерениям, где ось-X соответствует измерению силы статистического сигнала, а ось-Y соответствует измерению статистической значимости сигнала. Например, в генетических ассоциациях контрольная группа, такая как полногеномный поиск ассоциаций, на диаграмме точка представляет однонуклеотидный полиморфизм. Значение по оси-X может быть диапазоном изменения, по оси-Y может быть -log10 p-значения из хи-квадрата.[1]

Ссылки

  1. Volcano plot. BioData.wiki
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.