(no subject)
Mar. 15th, 2019 01:57 pmЯ тут допереподаю... допереподававываю... пересабмичиваю короче статью про куПЦР, и вот мне стало ясно видно, за что я не люблю RNA-seq. Не поймите меня неправильно - я не утверждаю, что ВЕСЬ RNA-seq - это фигня. Отнюдь. Однако вот его квантификационная часть, особенно в случае с single-cell RNA-seq, вызывает у меня БААААЛЬШИЕ вопросы.
Просто из тех данных по большой туче генов, которые мы делали (и все конечно же еще не публикованы), там две сотни генов, стало видно, что ПЦР-рение генов - это НЕПРАВИЛЬНАЯ стратегия квантификации. Во всяком случае так, как она сейчас делается. Типа загнал в машину и она тебе дала цифры. Машина всегда даст цифры; но вот если хотеть делать реальную науку, надо это помнить: сами по себе цифры никогда не панацея. Машина всегда даст тебе цифры. Но есть такая фраза: garbage in - garbage out. Загрузишь в машину мусор - получишь на выходе мусор-цифры. И они могут даже выглядеть прилично. Но они неправда.
Почему? Потому что если проследить кинетику всей ПЦР-реакции на всей ее протяжении по этим генам, то станет понятно, что, во-первых, замедление эффективности (т.е. насыщение) реакции идет с разной скоростью у разных генов; а во-вторых, из полученных кривых складывается вывод, что ЛЮБАЯ ПЦР-реакция идет со 100%-й эффективностью в начале. Я это доказать не могу, я могу только смоделировать, какую картинку мы видим, когда это так - и какую картинку мы видели бы, если бы это было не так. И ну никак не совпадет эта ихняя гипотеза, что у генов разная эффективность, с тем, что видно в реальности. Получается, что у всех генов изначально ПЦР-эффективность 100%-ная. Потом она падает, причем для разных генов с разной скоростью. Я бы даже сказала, что с биологической точки зрения, так оно по идее и должно было бы быть. Материал химический один и тот же - последовательность ДНК, энзим один и тот же - полимераза, с какого бы биологического перепугу она умножала разные последовательности с разной эффективностью, я имею в виду в начале реакции?
Так вот. Это означает, что если при выполнении single-cell RNA-seq вы поставите СЛИШКОМ МНОГО циклов ПЦР, вы получите на выходе неквантифицируемые данные.
Это я вам руку даю на отсечение. Потому что после н-ного цикла у вас всё пойдет вразнос.
Я понимаю, что в нынешней реальности это всё уже вообще никому неинтересно. Биологи они вообще... не такие как физики, им неинтересно разбираться в цифрах, это физики там будут корпеть над десятой цифрой после запятой и искать бозоны хиггса; биологи не такие - им лишь бы были цифры, из которых нарисовать картинку. Ну так а картинку нарисовать из любых цифр можно, вообще любых.
Я зато в процессе работы над этим мааааленьким вопросом прониклась высказываниями Фрэнсиса Гальтона, в частности его высказыванием "если можешь - считай". Whenever you can, count.
Потому что на глаз это одно, а на математике это другое совсем может быть и вообще нетривиально. Математика вообще это очень прикольно и практически как магия. Это сложно, но магия же тоже должно быть сложно, нет?
Я знаю, что они все равно будут single-cell RNA-seq-ить. И выкладывать. И в какой-то момент создастся еще больший конфуз, чем сейчас. Сейчас еще молекулярку можно считать практически воспроизводимой. Неквантифицируемой, но во всяком случае воспроизводимой. А вот если они начнут уже ВЫВОДЫ делать основании этих single-cell RNA-seq, то там начнется парад невоспроизводимости. Это я вот предрекаю как пророк. Да.))
Просто из тех данных по большой туче генов, которые мы делали (и все конечно же еще не публикованы), там две сотни генов, стало видно, что ПЦР-рение генов - это НЕПРАВИЛЬНАЯ стратегия квантификации. Во всяком случае так, как она сейчас делается. Типа загнал в машину и она тебе дала цифры. Машина всегда даст цифры; но вот если хотеть делать реальную науку, надо это помнить: сами по себе цифры никогда не панацея. Машина всегда даст тебе цифры. Но есть такая фраза: garbage in - garbage out. Загрузишь в машину мусор - получишь на выходе мусор-цифры. И они могут даже выглядеть прилично. Но они неправда.
Почему? Потому что если проследить кинетику всей ПЦР-реакции на всей ее протяжении по этим генам, то станет понятно, что, во-первых, замедление эффективности (т.е. насыщение) реакции идет с разной скоростью у разных генов; а во-вторых, из полученных кривых складывается вывод, что ЛЮБАЯ ПЦР-реакция идет со 100%-й эффективностью в начале. Я это доказать не могу, я могу только смоделировать, какую картинку мы видим, когда это так - и какую картинку мы видели бы, если бы это было не так. И ну никак не совпадет эта ихняя гипотеза, что у генов разная эффективность, с тем, что видно в реальности. Получается, что у всех генов изначально ПЦР-эффективность 100%-ная. Потом она падает, причем для разных генов с разной скоростью. Я бы даже сказала, что с биологической точки зрения, так оно по идее и должно было бы быть. Материал химический один и тот же - последовательность ДНК, энзим один и тот же - полимераза, с какого бы биологического перепугу она умножала разные последовательности с разной эффективностью, я имею в виду в начале реакции?
Так вот. Это означает, что если при выполнении single-cell RNA-seq вы поставите СЛИШКОМ МНОГО циклов ПЦР, вы получите на выходе неквантифицируемые данные.
Это я вам руку даю на отсечение. Потому что после н-ного цикла у вас всё пойдет вразнос.
Я понимаю, что в нынешней реальности это всё уже вообще никому неинтересно. Биологи они вообще... не такие как физики, им неинтересно разбираться в цифрах, это физики там будут корпеть над десятой цифрой после запятой и искать бозоны хиггса; биологи не такие - им лишь бы были цифры, из которых нарисовать картинку. Ну так а картинку нарисовать из любых цифр можно, вообще любых.
Я зато в процессе работы над этим мааааленьким вопросом прониклась высказываниями Фрэнсиса Гальтона, в частности его высказыванием "если можешь - считай". Whenever you can, count.
Потому что на глаз это одно, а на математике это другое совсем может быть и вообще нетривиально. Математика вообще это очень прикольно и практически как магия. Это сложно, но магия же тоже должно быть сложно, нет?
Я знаю, что они все равно будут single-cell RNA-seq-ить. И выкладывать. И в какой-то момент создастся еще больший конфуз, чем сейчас. Сейчас еще молекулярку можно считать практически воспроизводимой. Неквантифицируемой, но во всяком случае воспроизводимой. А вот если они начнут уже ВЫВОДЫ делать основании этих single-cell RNA-seq, то там начнется парад невоспроизводимости. Это я вот предрекаю как пророк. Да.))