aridmoors: (Default)
[personal profile] aridmoors
Я тут допереподаю... допереподававываю... пересабмичиваю короче статью про куПЦР, и вот мне стало ясно видно, за что я не люблю RNA-seq. Не поймите меня неправильно - я не утверждаю, что ВЕСЬ RNA-seq - это фигня. Отнюдь. Однако вот его квантификационная часть, особенно в случае с single-cell RNA-seq, вызывает у меня БААААЛЬШИЕ вопросы.

Просто из тех данных по большой туче генов, которые мы делали (и все конечно же еще не публикованы), там две сотни генов, стало видно, что ПЦР-рение генов - это НЕПРАВИЛЬНАЯ стратегия квантификации. Во всяком случае так, как она сейчас делается. Типа загнал в машину и она тебе дала цифры. Машина всегда даст цифры; но вот если хотеть делать реальную науку, надо это помнить: сами по себе цифры никогда не панацея. Машина всегда даст тебе цифры. Но есть такая фраза: garbage in - garbage out. Загрузишь в машину мусор - получишь на выходе мусор-цифры. И они могут даже выглядеть прилично. Но они неправда.

Почему? Потому что если проследить кинетику всей ПЦР-реакции на всей ее протяжении по этим генам, то станет понятно, что, во-первых, замедление эффективности (т.е. насыщение) реакции идет с разной скоростью у разных генов; а во-вторых, из полученных кривых складывается вывод, что ЛЮБАЯ ПЦР-реакция идет со 100%-й эффективностью в начале. Я это доказать не могу, я могу только смоделировать, какую картинку мы видим, когда это так - и какую картинку мы видели бы, если бы это было не так. И ну никак не совпадет эта ихняя гипотеза, что у генов разная эффективность, с тем, что видно в реальности. Получается, что у всех генов изначально ПЦР-эффективность 100%-ная. Потом она падает, причем для разных генов с разной скоростью. Я бы даже сказала, что с биологической точки зрения, так оно по идее и должно было бы быть. Материал химический один и тот же - последовательность ДНК, энзим один и тот же - полимераза, с какого бы биологического перепугу она умножала разные последовательности с разной эффективностью, я имею в виду в начале реакции?

Так вот. Это означает, что если при выполнении single-cell RNA-seq вы поставите СЛИШКОМ МНОГО циклов ПЦР, вы получите на выходе неквантифицируемые данные.
Это я вам руку даю на отсечение. Потому что после н-ного цикла у вас всё пойдет вразнос.

Я понимаю, что в нынешней реальности это всё уже вообще никому неинтересно. Биологи они вообще... не такие как физики, им неинтересно разбираться в цифрах, это физики там будут корпеть над десятой цифрой после запятой и искать бозоны хиггса; биологи не такие - им лишь бы были цифры, из которых нарисовать картинку. Ну так а картинку нарисовать из любых цифр можно, вообще любых.

Я зато в процессе работы над этим мааааленьким вопросом прониклась высказываниями Фрэнсиса Гальтона, в частности его высказыванием "если можешь - считай". Whenever you can, count.

Потому что на глаз это одно, а на математике это другое совсем может быть и вообще нетривиально. Математика вообще это очень прикольно и практически как магия. Это сложно, но магия же тоже должно быть сложно, нет?

Я знаю, что они все равно будут single-cell RNA-seq-ить. И выкладывать. И в какой-то момент создастся еще больший конфуз, чем сейчас. Сейчас еще молекулярку можно считать практически воспроизводимой. Неквантифицируемой, но во всяком случае воспроизводимой. А вот если они начнут уже ВЫВОДЫ делать основании этих single-cell RNA-seq, то там начнется парад невоспроизводимости. Это я вот предрекаю как пророк. Да.))

Date: 2019-03-15 05:06 am (UTC)

Date: 2019-03-15 06:37 am (UTC)
From: [identity profile] randomisator.livejournal.com
Резко напомнило ALD:) Ещё ни один человек не ответил мне на банальный вопрос "А почему вы уверены, что на каждой стадии наслаивания выход ровно 100% и смотрели ли вы, насколько неоднородной выйдет ваша пленка, если он всё-таки 99.9%, а стадий наслаивания у вас сотня-другая?"

Date: 2019-03-15 06:45 am (UTC)
From: [identity profile] dannallar.livejournal.com
Спасибо большое!

Date: 2019-03-15 06:57 am (UTC)
From: [identity profile] vida-louca.livejournal.com
Поясните, если можно, физику, в чём тут дело. Почему по Вашему мнению "ЛЮБАЯ ПЦР-реакция идет со 100%-й эффективностью в начале и далее насыщение реакции идет с разной скоростью у разных генов".
Ведь, казалось бы, Вы описываете неравновесный процесс, нормированный на 100% вначале и идущий далее с разной скоростью (разным затуханием). Это естественно для разных генов отвечать с разным характерным временем на одно и то же воздействие.
И почему будет плохо, если не сделать нормировку на 100% в начальный момент времени, как это делают Ваши "виртуальные" оппоненты? Что, алгоритм машинной обработки будет другой?

Date: 2019-03-15 07:46 am (UTC)
From: [identity profile] aridmoors.livejournal.com
Машина не засекает сигнал на 100%, она может его уловить только когда уже хз сколько сигнала там, то есть на позжжних стадиях. То есть процесс, который мы наблюдаем, наблюдется только уже в фазе насыщения реакции.

Date: 2019-03-15 08:55 am (UTC)
From: [identity profile] vida-louca.livejournal.com
Кажется, понимаю. Это всё равно как судить о всём диапазоне изменения теплоёмкости кристалла по ее асимптотическому выходу на полочку (см. функция Дебая). То есть, судить о характерной температуре Дебая, когда её уже прошли.
Но, может быть, у Вас что-то другое.

Date: 2019-03-16 02:07 am (UTC)
From: [identity profile] aridmoors.livejournal.com
По описанию похоже)))

Date: 2019-03-15 07:38 am (UTC)
From: [identity profile] staerum.livejournal.com
А какие-то корректирующие данные по эффективности реакций на разных генах собирается, анализируется, могут потом быть использованы для (ре)анализа неквантифицируемых результатов?

Date: 2019-03-15 07:47 am (UTC)
From: [identity profile] aridmoors.livejournal.com
Не, когда "неквантифцируемые резултаты" - это когда по тысячам генов собирается, там никто не может ни повторить, ни перепроверить. Типо вот собрали вот так-то, и всё.

Date: 2019-03-15 08:19 am (UTC)

Date: 2019-03-15 10:33 am (UTC)
From: [identity profile] freedom_of_sea.livejournal.com
если гены умножаются одинаково, и в начале 100% одинаково,
то почему же в конце их концентрация разная?

Зависит ли это от гена, его длины, локации или это случайное блуждание с последующим умножением?

По идее статистический метаанализ данных RNA-ПЦР может дать ответ. Не нужно с пробирками бегать, только переобсчитать готовые данные.

ну што за я не знаю!..

Date: 2019-03-15 12:12 pm (UTC)
From: [identity profile] scholarpunk.livejournal.com
САБЖ!! Ну вот и пишите же скорее (пока маниакальная стадия не кончилась) разгромную статью! В какое-нибудь Nature Methods...

Вон, просамоциируюсь:

"...В 2008 году вышла немного шокировавшая научное сообщество статья С. Natanson et al. с результатами метаанализа шестнадцати рандомизированных контролируемых испытаний пяти типов бесклеточных КЗПК (HemAssist, Hemopure®, Hemolink®, PolyHeme® и Hemospan®) [70], в которой были прямиком озвучены назревавшие уже долгое время проблемы. В ней был сделан вывод о том, что использование внеклеточных КЗПК связано с повышенной вероятностью инфаркта миокарда по сравнению с контролем. Все поняли, что надо что-то делать, и прогресс в области разработки КЗПК получил новый импульс [71].
Стала появляться всякая экзотика..."

70. Natanson, C., et al., Cell-free hemoglobin-based blood substitutes and risk of myocardial infarction and death: a meta-analysis. JAMA, 2008. 299(19): p. 2304-12.
71. Njoku, M., D. St Peter, and C.F. Mackenzie, Haemoglobin-based oxygen carriers: indications and future applications. British journal of hospital medicine, 2015. 76(2): p. 78-83.

Мне все время пеняли, что так нельзя, что "это не для научной статьи, а в курилке", и потому я так вяло написал - но в свое время в соответсвующих научных кругах визгу было почище, чем со спидоустойчивыми маденцами.

Так что давайте скорее!!! Тут тема-то поширше будет. И хайпу, соответственно, больше.

> "если можешь - считай"

Пьффь! Я вот последнюю статью (ну как статью - сатьишку, но тем не менее) вообще без единой цифры сделал, ггы. Выпрочем, памойму говорил уже о том.

ЗЫ. А, да, КЗПК - это идиотская аббревиатура "кровезаменитель переносчик кислорода", при чем относящаяся почему-то только к гемоглообировым...
Edited Date: 2019-03-15 12:15 pm (UTC)

Re: ну што за я не знаю!..

Date: 2019-03-18 01:32 pm (UTC)
From: [identity profile] alef-grizley.livejournal.com
Поддерживаю!! (предложение писать разгромную статью)

Re: ну што за я не знаю!..

Date: 2019-03-18 05:35 pm (UTC)
From: [identity profile] scholarpunk.livejournal.com
По рогам им, и промежъ имъ!!!!

Re: ну што за я не знаю!..

Date: 2019-03-18 06:30 pm (UTC)
From: [identity profile] nil-0.livejournal.com
Народ жаждет хорошей драки!

Date: 2019-03-15 01:31 pm (UTC)
From: (Anonymous)
А меня смущают еще больше, когда секвенируют синг селл транскриптому, фиксируя клетки, и сответственно анализируют то,что в ядре осталось.....

Date: 2019-03-16 02:28 am (UTC)
From: [identity profile] aridmoors.livejournal.com
Там вся процедура вообще...fishy, подозрительная.

Date: 2019-03-16 06:25 am (UTC)
From: [identity profile] knyasa-o.livejournal.com
Не знаю, как во всем мире, но у нас в России, если физика, то +математика, а если биология, то может и математики не знать совсем, хотя всем должно быть понятно, что любая наука должна в конце концов оперировать формулами

Date: 2019-03-16 07:42 am (UTC)
From: [identity profile] miss-linguini.livejournal.com
Ну я бы так не сказала, сейчас в любой молекулярно-биологической статье в методах есть статистическая обработка данных.... так что приходится и биологам погружаться в чудный мир цифр, статистики

Date: 2019-03-22 09:25 am (UTC)
From: [identity profile] knyasa-o.livejournal.com
Вот именно, "приходится" и "статистики" до нормальных математических методов и их понимания еще расти и расти

Date: 2019-03-16 08:26 am (UTC)
From: [identity profile] ultraohr.livejournal.com
Складывается впечатление, что для заметной части (оценка снизу) биологов понятие "стандартизация измерений" это нечто из параллельной Вселенной. Как и вся метрология в целом.
К примеру, вот эта заметка (https://www.nature.com/articles/d42473-018-00136-7?mvt=i&mvn=e785c04b9d634801817ca3cba7d4b890&mvp=NA-NATUCOM-11237938&mvl=Home) поразила в самую пятку. Процитирую основной изюм:
"Research exploring the interplay between the microbiome and health has yielded intriguing insights, but also discovered unsettling variability in the data obtained by different laboratories. A comparison [...] concluded that differences in the DNA extraction protocols led to significant changes in the observed ratios of Firmicutes and Bacteroidetes [...]
There seems (sic!) to be a systematic problem. “Relatively minor alterations in the DNA extraction procedure or in the bioinformatics analysis can give a distorted view...”
Похоже, пчёлы начали что-то подозревать.

Date: 2019-05-26 12:40 pm (UTC)
From: [identity profile] portia-whiskey.livejournal.com
Господи. Бальзам на раны. У вас случайно нет ссылок на недавние статьи или просто мысли по теме на английском?

Date: 2019-05-26 01:08 pm (UTC)
From: [identity profile] aridmoors.livejournal.com
Спасибо за комментарий. Мыслей на английском у меня нет, статей подобного содержания не встречала, и вряд ли они существуют, насколько мне известно. Это мои личные мысли.

Меня уже распинали не раз за эти мысли, и я сильно отчаялась их кому-то говорить. Никому это не надо - истинность, воспроизводимость, главное бабло дают, данные идут, графики рисуются.(((

Date: 2019-05-26 02:08 pm (UTC)
From: [identity profile] portia-whiskey.livejournal.com
Графики, конечно, рисуются и статьи печатаются, но все-таки желание разобраться у многих тоже есть, потому что невоспроизводимость и фигня на выходе (в сочетании со зря потраченными деньгами и временем) сильно раздражают и озадачивают. Просто мало кто может это аргументированно озвучить, если не для печати, то хотя бы для осмысленного разговора с коллегами в кулуарах. В общем, если вдруг соберетесь что-то написать или наткнетесь на уже написанное, дайте знать плиз...У нас сейчас как раз активно двигают single-cell RNA-seq, у народа очень большой интерес, но по факту мало кто разбирается в тонкостях процесса, отношение как к black box, куда загружаешь образцы, и на выходе тебе оператор и статистик выдают циферки, а что там произошло в середине - фиг знает.

Profile

aridmoors: (Default)
aridmoors

January 2026

S M T W T F S
    123
45678910
11121314151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 20th, 2026 10:37 am
Powered by Dreamwidth Studios