Mar. 15th, 2019

aridmoors: (Default)
Я тут допереподаю... допереподававываю... пересабмичиваю короче статью про куПЦР, и вот мне стало ясно видно, за что я не люблю RNA-seq. Не поймите меня неправильно - я не утверждаю, что ВЕСЬ RNA-seq - это фигня. Отнюдь. Однако вот его квантификационная часть, особенно в случае с single-cell RNA-seq, вызывает у меня БААААЛЬШИЕ вопросы.

Просто из тех данных по большой туче генов, которые мы делали (и все конечно же еще не публикованы), там две сотни генов, стало видно, что ПЦР-рение генов - это НЕПРАВИЛЬНАЯ стратегия квантификации. Во всяком случае так, как она сейчас делается. Типа загнал в машину и она тебе дала цифры. Машина всегда даст цифры; но вот если хотеть делать реальную науку, надо это помнить: сами по себе цифры никогда не панацея. Машина всегда даст тебе цифры. Но есть такая фраза: garbage in - garbage out. Загрузишь в машину мусор - получишь на выходе мусор-цифры. И они могут даже выглядеть прилично. Но они неправда.

Почему? Потому что если проследить кинетику всей ПЦР-реакции на всей ее протяжении по этим генам, то станет понятно, что, во-первых, замедление эффективности (т.е. насыщение) реакции идет с разной скоростью у разных генов; а во-вторых, из полученных кривых складывается вывод, что ЛЮБАЯ ПЦР-реакция идет со 100%-й эффективностью в начале. Я это доказать не могу, я могу только смоделировать, какую картинку мы видим, когда это так - и какую картинку мы видели бы, если бы это было не так. И ну никак не совпадет эта ихняя гипотеза, что у генов разная эффективность, с тем, что видно в реальности. Получается, что у всех генов изначально ПЦР-эффективность 100%-ная. Потом она падает, причем для разных генов с разной скоростью. Я бы даже сказала, что с биологической точки зрения, так оно по идее и должно было бы быть. Материал химический один и тот же - последовательность ДНК, энзим один и тот же - полимераза, с какого бы биологического перепугу она умножала разные последовательности с разной эффективностью, я имею в виду в начале реакции?

Так вот. Это означает, что если при выполнении single-cell RNA-seq вы поставите СЛИШКОМ МНОГО циклов ПЦР, вы получите на выходе неквантифицируемые данные.
Это я вам руку даю на отсечение. Потому что после н-ного цикла у вас всё пойдет вразнос.

Я понимаю, что в нынешней реальности это всё уже вообще никому неинтересно. Биологи они вообще... не такие как физики, им неинтересно разбираться в цифрах, это физики там будут корпеть над десятой цифрой после запятой и искать бозоны хиггса; биологи не такие - им лишь бы были цифры, из которых нарисовать картинку. Ну так а картинку нарисовать из любых цифр можно, вообще любых.

Я зато в процессе работы над этим мааааленьким вопросом прониклась высказываниями Фрэнсиса Гальтона, в частности его высказыванием "если можешь - считай". Whenever you can, count.

Потому что на глаз это одно, а на математике это другое совсем может быть и вообще нетривиально. Математика вообще это очень прикольно и практически как магия. Это сложно, но магия же тоже должно быть сложно, нет?

Я знаю, что они все равно будут single-cell RNA-seq-ить. И выкладывать. И в какой-то момент создастся еще больший конфуз, чем сейчас. Сейчас еще молекулярку можно считать практически воспроизводимой. Неквантифицируемой, но во всяком случае воспроизводимой. А вот если они начнут уже ВЫВОДЫ делать основании этих single-cell RNA-seq, то там начнется парад невоспроизводимости. Это я вот предрекаю как пророк. Да.))

Profile

aridmoors: (Default)
aridmoors

January 2026

S M T W T F S
    123
45678910
11121314151617
18192021222324
25262728293031

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 20th, 2026 10:57 am
Powered by Dreamwidth Studios