(no subject)
Mar. 15th, 2019 01:57 pmЯ тут допереподаю... допереподававываю... пересабмичиваю короче статью про куПЦР, и вот мне стало ясно видно, за что я не люблю RNA-seq. Не поймите меня неправильно - я не утверждаю, что ВЕСЬ RNA-seq - это фигня. Отнюдь. Однако вот его квантификационная часть, особенно в случае с single-cell RNA-seq, вызывает у меня БААААЛЬШИЕ вопросы.
Просто из тех данных по большой туче генов, которые мы делали (и все конечно же еще не публикованы), там две сотни генов, стало видно, что ПЦР-рение генов - это НЕПРАВИЛЬНАЯ стратегия квантификации. Во всяком случае так, как она сейчас делается. Типа загнал в машину и она тебе дала цифры. Машина всегда даст цифры; но вот если хотеть делать реальную науку, надо это помнить: сами по себе цифры никогда не панацея. Машина всегда даст тебе цифры. Но есть такая фраза: garbage in - garbage out. Загрузишь в машину мусор - получишь на выходе мусор-цифры. И они могут даже выглядеть прилично. Но они неправда.
Почему? Потому что если проследить кинетику всей ПЦР-реакции на всей ее протяжении по этим генам, то станет понятно, что, во-первых, замедление эффективности (т.е. насыщение) реакции идет с разной скоростью у разных генов; а во-вторых, из полученных кривых складывается вывод, что ЛЮБАЯ ПЦР-реакция идет со 100%-й эффективностью в начале. Я это доказать не могу, я могу только смоделировать, какую картинку мы видим, когда это так - и какую картинку мы видели бы, если бы это было не так. И ну никак не совпадет эта ихняя гипотеза, что у генов разная эффективность, с тем, что видно в реальности. Получается, что у всех генов изначально ПЦР-эффективность 100%-ная. Потом она падает, причем для разных генов с разной скоростью. Я бы даже сказала, что с биологической точки зрения, так оно по идее и должно было бы быть. Материал химический один и тот же - последовательность ДНК, энзим один и тот же - полимераза, с какого бы биологического перепугу она умножала разные последовательности с разной эффективностью, я имею в виду в начале реакции?
Так вот. Это означает, что если при выполнении single-cell RNA-seq вы поставите СЛИШКОМ МНОГО циклов ПЦР, вы получите на выходе неквантифицируемые данные.
Это я вам руку даю на отсечение. Потому что после н-ного цикла у вас всё пойдет вразнос.
Я понимаю, что в нынешней реальности это всё уже вообще никому неинтересно. Биологи они вообще... не такие как физики, им неинтересно разбираться в цифрах, это физики там будут корпеть над десятой цифрой после запятой и искать бозоны хиггса; биологи не такие - им лишь бы были цифры, из которых нарисовать картинку. Ну так а картинку нарисовать из любых цифр можно, вообще любых.
Я зато в процессе работы над этим мааааленьким вопросом прониклась высказываниями Фрэнсиса Гальтона, в частности его высказыванием "если можешь - считай". Whenever you can, count.
Потому что на глаз это одно, а на математике это другое совсем может быть и вообще нетривиально. Математика вообще это очень прикольно и практически как магия. Это сложно, но магия же тоже должно быть сложно, нет?
Я знаю, что они все равно будут single-cell RNA-seq-ить. И выкладывать. И в какой-то момент создастся еще больший конфуз, чем сейчас. Сейчас еще молекулярку можно считать практически воспроизводимой. Неквантифицируемой, но во всяком случае воспроизводимой. А вот если они начнут уже ВЫВОДЫ делать основании этих single-cell RNA-seq, то там начнется парад невоспроизводимости. Это я вот предрекаю как пророк. Да.))
Просто из тех данных по большой туче генов, которые мы делали (и все конечно же еще не публикованы), там две сотни генов, стало видно, что ПЦР-рение генов - это НЕПРАВИЛЬНАЯ стратегия квантификации. Во всяком случае так, как она сейчас делается. Типа загнал в машину и она тебе дала цифры. Машина всегда даст цифры; но вот если хотеть делать реальную науку, надо это помнить: сами по себе цифры никогда не панацея. Машина всегда даст тебе цифры. Но есть такая фраза: garbage in - garbage out. Загрузишь в машину мусор - получишь на выходе мусор-цифры. И они могут даже выглядеть прилично. Но они неправда.
Почему? Потому что если проследить кинетику всей ПЦР-реакции на всей ее протяжении по этим генам, то станет понятно, что, во-первых, замедление эффективности (т.е. насыщение) реакции идет с разной скоростью у разных генов; а во-вторых, из полученных кривых складывается вывод, что ЛЮБАЯ ПЦР-реакция идет со 100%-й эффективностью в начале. Я это доказать не могу, я могу только смоделировать, какую картинку мы видим, когда это так - и какую картинку мы видели бы, если бы это было не так. И ну никак не совпадет эта ихняя гипотеза, что у генов разная эффективность, с тем, что видно в реальности. Получается, что у всех генов изначально ПЦР-эффективность 100%-ная. Потом она падает, причем для разных генов с разной скоростью. Я бы даже сказала, что с биологической точки зрения, так оно по идее и должно было бы быть. Материал химический один и тот же - последовательность ДНК, энзим один и тот же - полимераза, с какого бы биологического перепугу она умножала разные последовательности с разной эффективностью, я имею в виду в начале реакции?
Так вот. Это означает, что если при выполнении single-cell RNA-seq вы поставите СЛИШКОМ МНОГО циклов ПЦР, вы получите на выходе неквантифицируемые данные.
Это я вам руку даю на отсечение. Потому что после н-ного цикла у вас всё пойдет вразнос.
Я понимаю, что в нынешней реальности это всё уже вообще никому неинтересно. Биологи они вообще... не такие как физики, им неинтересно разбираться в цифрах, это физики там будут корпеть над десятой цифрой после запятой и искать бозоны хиггса; биологи не такие - им лишь бы были цифры, из которых нарисовать картинку. Ну так а картинку нарисовать из любых цифр можно, вообще любых.
Я зато в процессе работы над этим мааааленьким вопросом прониклась высказываниями Фрэнсиса Гальтона, в частности его высказыванием "если можешь - считай". Whenever you can, count.
Потому что на глаз это одно, а на математике это другое совсем может быть и вообще нетривиально. Математика вообще это очень прикольно и практически как магия. Это сложно, но магия же тоже должно быть сложно, нет?
Я знаю, что они все равно будут single-cell RNA-seq-ить. И выкладывать. И в какой-то момент создастся еще больший конфуз, чем сейчас. Сейчас еще молекулярку можно считать практически воспроизводимой. Неквантифицируемой, но во всяком случае воспроизводимой. А вот если они начнут уже ВЫВОДЫ делать основании этих single-cell RNA-seq, то там начнется парад невоспроизводимости. Это я вот предрекаю как пророк. Да.))
no subject
Date: 2019-03-15 05:06 am (UTC)no subject
Date: 2019-03-15 06:37 am (UTC)no subject
Date: 2019-03-15 06:45 am (UTC)no subject
Date: 2019-03-15 06:57 am (UTC)Ведь, казалось бы, Вы описываете неравновесный процесс, нормированный на 100% вначале и идущий далее с разной скоростью (разным затуханием). Это естественно для разных генов отвечать с разным характерным временем на одно и то же воздействие.
И почему будет плохо, если не сделать нормировку на 100% в начальный момент времени, как это делают Ваши "виртуальные" оппоненты? Что, алгоритм машинной обработки будет другой?
no subject
Date: 2019-03-15 07:46 am (UTC)no subject
Date: 2019-03-15 08:55 am (UTC)Но, может быть, у Вас что-то другое.
no subject
Date: 2019-03-16 02:07 am (UTC)no subject
Date: 2019-03-15 07:38 am (UTC)no subject
Date: 2019-03-15 07:47 am (UTC)no subject
Date: 2019-03-15 08:19 am (UTC)no subject
Date: 2019-03-15 10:33 am (UTC)то почему же в конце их концентрация разная?
Зависит ли это от гена, его длины, локации или это случайное блуждание с последующим умножением?
По идее статистический метаанализ данных RNA-ПЦР может дать ответ. Не нужно с пробирками бегать, только переобсчитать готовые данные.
ну што за я не знаю!..
Date: 2019-03-15 12:12 pm (UTC)Вон, просамоциируюсь:
"...В 2008 году вышла немного шокировавшая научное сообщество статья С. Natanson et al. с результатами метаанализа шестнадцати рандомизированных контролируемых испытаний пяти типов бесклеточных КЗПК (HemAssist, Hemopure®, Hemolink®, PolyHeme® и Hemospan®) [70], в которой были прямиком озвучены назревавшие уже долгое время проблемы. В ней был сделан вывод о том, что использование внеклеточных КЗПК связано с повышенной вероятностью инфаркта миокарда по сравнению с контролем. Все поняли, что надо что-то делать, и прогресс в области разработки КЗПК получил новый импульс [71].
Стала появляться всякая экзотика..."
70. Natanson, C., et al., Cell-free hemoglobin-based blood substitutes and risk of myocardial infarction and death: a meta-analysis. JAMA, 2008. 299(19): p. 2304-12.
71. Njoku, M., D. St Peter, and C.F. Mackenzie, Haemoglobin-based oxygen carriers: indications and future applications. British journal of hospital medicine, 2015. 76(2): p. 78-83.
Мне все время пеняли, что так нельзя, что "это не для научной статьи, а в курилке", и потому я так вяло написал - но в свое время в соответсвующих научных кругах визгу было почище, чем со спидоустойчивыми маденцами.
Так что давайте скорее!!! Тут тема-то поширше будет. И хайпу, соответственно, больше.
> "если можешь - считай"
Пьффь! Я вот последнюю статью (ну как статью - сатьишку, но тем не менее) вообще без единой цифры сделал, ггы. Выпрочем, памойму говорил уже о том.
ЗЫ. А, да, КЗПК - это идиотская аббревиатура "кровезаменитель переносчик кислорода", при чем относящаяся почему-то только к гемоглообировым...
Re: ну што за я не знаю!..
Date: 2019-03-18 01:32 pm (UTC)Re: ну што за я не знаю!..
Date: 2019-03-18 05:35 pm (UTC)Re: ну што за я не знаю!..
Date: 2019-03-18 06:30 pm (UTC)no subject
Date: 2019-03-15 01:31 pm (UTC)no subject
Date: 2019-03-16 02:28 am (UTC)no subject
Date: 2019-03-16 06:25 am (UTC)no subject
Date: 2019-03-16 07:42 am (UTC)no subject
Date: 2019-03-22 09:25 am (UTC)no subject
Date: 2019-03-16 08:26 am (UTC)К примеру, вот эта заметка (https://www.nature.com/articles/d42473-018-00136-7?mvt=i&mvn=e785c04b9d634801817ca3cba7d4b890&mvp=NA-NATUCOM-11237938&mvl=Home) поразила в самую пятку. Процитирую основной изюм:
"Research exploring the interplay between the microbiome and health has yielded intriguing insights, but also discovered unsettling variability in the data obtained by different laboratories. A comparison [...] concluded that differences in the DNA extraction protocols led to significant changes in the observed ratios of Firmicutes and Bacteroidetes [...]
There seems (sic!) to be a systematic problem. “Relatively minor alterations in the DNA extraction procedure or in the bioinformatics analysis can give a distorted view...”
Похоже, пчёлы начали что-то подозревать.
no subject
Date: 2019-05-26 12:40 pm (UTC)no subject
Date: 2019-05-26 01:08 pm (UTC)Меня уже распинали не раз за эти мысли, и я сильно отчаялась их кому-то говорить. Никому это не надо - истинность, воспроизводимость, главное бабло дают, данные идут, графики рисуются.(((
no subject
Date: 2019-05-26 02:08 pm (UTC)