У Эньхуэй, Цяо Лян*
Хімічны факультэт Універсітэта Фудань, Шанхай 200433, Кітай
Мікраарганізмы цесна звязаны з хваробамі і здароўем чалавека. Як зразумець склад мікробных супольнасцяў і іх функцыі - важная праблема, якую неабходна тэрмінова вывучыць. У апошнія гады метапратэёміка стала важным тэхнічным сродкам для вывучэння складу і функцый мікраарганізмаў. Аднак з-за складанасці і высокай гетэрагеннасці ўзораў мікробных супольнасцей апрацоўка ўзораў, збор даных мас-спектраметрыі і аналіз даных сталі трыма асноўнымі праблемамі, з якімі ў цяперашні час сутыкаецца метапратэёміка. У метапратэёмічным аналізе часта бывае неабходна аптымізаваць папярэднюю апрацоўку розных тыпаў узораў і прыняць розныя схемы падзелу мікробаў, узбагачэння, экстракцыі і лізісу. Падобна пратэому аднаго віду, рэжымы збору даных мас-спектраметрыі ў метапратэоміцы ўключаюць у сябе рэжым збору, які залежыць ад дадзеных (DDA) і рэжым збору, незалежнага ад дадзеных (DIA). Рэжым збору даных DIA можа цалкам сабраць пептыдную інфармацыю ўзору і мае вялікі патэнцыял развіцця. Аднак з-за складанасці ўзораў метапратэомаў аналіз дадзеных DIA стаў галоўнай праблемай, якая перашкаджае глыбокаму ахопу метапратэёмікі. З пункту гледжання аналізу дадзеных, найбольш важным этапам з'яўляецца пабудова базы дадзеных бялковых паслядоўнасцяў. Памер і паўната базы даных не толькі моцна ўплываюць на колькасць ідэнтыфікацый, але таксама ўплываюць на аналіз на відавым і функцыянальным узроўнях. У цяперашні час залатым стандартам для пабудовы базы дадзеных метапратэомаў з'яўляецца база дадзеных бялковых паслядоўнасцей, заснаваная на метагеноме. У той жа час метад фільтрацыі агульнадаступных баз дадзеных, заснаваны на ітэрацыйным пошуку, таксама даказаў вялікую практычную каштоўнасць. З пункту гледжання канкрэтных стратэгій аналізу дадзеных, метады аналізу дадзеных DIA, арыентаваныя на пептыды, занялі абсалютны мэйнстрым. З развіццём глыбокага навучання і штучнага інтэлекту гэта значна павысіць дакладнасць, ахоп і хуткасць аналізу макропротеомических даных. З пункту гледжання далейшага біяінфарматычнага аналізу, у апошнія гады была распрацавана серыя інструментаў анатацыі, якія могуць выконваць анатацыю відаў на ўзроўні бялку, пептыда і гена, каб атрымаць склад мікробных супольнасцей. У параўнанні з іншымі метадамі омікі, функцыянальны аналіз мікробных супольнасцей з'яўляецца унікальнай асаблівасцю макрапратэёмікі. Макрапратэёміка стала важнай часткай мульты-омічнага аналізу мікробных супольнасцей і ўсё яшчэ мае вялікі патэнцыял развіцця з пункту гледжання глыбіні ахопу, адчувальнасці выяўлення і паўнаты аналізу даных.
01Папярэдняя апрацоўка ўзору
У цяперашні час тэхналогія метапратэомікі шырока выкарыстоўваецца ў даследаваннях мікрабіёма чалавека, глебы, ежы, акіяна, актыўнага глею і іншых галінах. У параўнанні з аналізам пратэомаў аднаго віду, папярэдняя апрацоўка метапратэомаў складаных узораў сутыкаецца з большымі праблемамі. Мікробны склад у рэальных узорах складаны, дынамічны дыяпазон колькасці вялікі, структура клеткавай сценкі розных тыпаў мікраарганізмаў моцна адрозніваецца, і ўзоры часта ўтрымліваюць вялікую колькасць бялкоў гаспадара і іншых прымешак. Такім чынам, пры аналізе метапратэома часта бывае неабходна аптымізаваць розныя тыпы ўзораў і прыняць розныя схемы падзелу, узбагачэння, экстракцыі і лізісу мікробаў.
Вылучэнне мікробных метапратэомаў з розных узораў мае пэўнае падабенства, а таксама некаторыя адрозненні, але ў цяперашні час не хапае адзінага працэсу папярэдняй апрацоўкі для розных тыпаў узораў метапратэомаў.
02Збор даных мас-спектраметрыі
Пры драбавіковым пратэомным аналізе пептыдная сумесь пасля папярэдняй апрацоўкі спачатку аддзяляецца ў храматаграфічнай калонцы, а затым паступае ў мас-спектрометр для збору даных пасля іянізацыі. Падобна аналізу пратэома аднаго віду, рэжымы збору дадзеных мас-спектраметрыі ў аналізе макрапратэома ўключаюць рэжым DDA і рэжым DIA.
Дзякуючы бесперапыннай ітэрацыі і абнаўленню прыбораў мас-спектраметрыі, прыборы мас-спектраметрыі з больш высокай адчувальнасцю і разрознасцю прымяняюцца да метапратэома, і глыбіня ахопу аналізу метапратэома таксама пастаянна паляпшаецца. Доўгі час серыя мас-спектраметрычных прыбораў высокага раздзялення пад кіраўніцтвам Orbitrap шырока выкарыстоўвалася ў метапратэоме.
Табліца 1 арыгінальнага тэксту паказвае некаторыя рэпрэзентатыўныя даследаванні метапратэомікі з 2011 г. па цяперашні час з пункту гледжання тыпу ўзору, стратэгіі аналізу, прыбора мас-спектраметрыі, метаду збору дадзеных, праграмнага забеспячэння для аналізу і колькасці ідэнтыфікацый.
03Аналіз дадзеных мас-спектраметрыі
3.1 Стратэгія аналізу дадзеных DDA
3.1.1 Пошук у базе даных
3.1.2нановастратэгія секвенирования
3.2 Стратэгія аналізу дадзеных DIA
04 Класіфікацыя відаў і функцыянальная анатацыя
Склад мікробных супольнасцей на розных таксанамічных узроўнях з'яўляецца адным з ключавых напрамкаў даследаванняў мікрабіёма. У апошнія гады была распрацавана серыя інструментаў анатавання для анатавання відаў на ўзроўні бялкоў, пептыдаў і генаў для атрымання складу мікробных супольнасцей.
Сутнасць функцыянальнай анатацыі заключаецца ў параўнанні паслядоўнасці мэтавага бялку з базай дадзеных паслядоўнасці функцыянальнага бялку. З выкарыстаннем баз дадзеных функцый генаў, такіх як GO, COG, KEGG, eggNOG і г.д., можна праводзіць розныя аналізы функцыянальных анатацый бялкоў, ідэнтыфікаваных макрапратэомамі. Інструменты анатавання ўключаюць Blast2GO, DAVID, KOBAS і інш.
05 Рэзюмэ і прагноз
Мікраарганізмы гуляюць важную ролю ў здароўі і хваробах чалавека. У апошнія гады метапратэёміка стала важным тэхнічным сродкам вывучэння функцыянавання мікробных супольнасцей. Аналітычны працэс метапратэёмікі аналагічны працэсу пратэёмікі аднаго віду, але з-за складанасці аб'екта даследавання метапратэёмікі на кожным этапе аналізу неабходна прымяняць спецыфічныя стратэгіі даследавання, ад папярэдняй апрацоўкі ўзору, збору даных да аналізу даных. У цяперашні час, дзякуючы ўдасканаленню метадаў папярэдняй апрацоўкі, пастаянным інавацыям у тэхналогіі мас-спектраметрыі і хуткаму развіццю біяінфарматыкі, метапратэёміка дасягнула вялікага прагрэсу ў глыбіні ідэнтыфікацыі і сферы прымянення.
У працэсе папярэдняй апрацоўкі ўзораў макрапратэомаў трэба ў першую чаргу ўлічваць прыроду ўзору. Як аддзяліць мікраарганізмы ад клетак і бялкоў навакольнага асяроддзя - адна з ключавых задач, якія стаяць перад макрапратэомамі, а баланс паміж эфектыўнасцю аддзялення і стратай мікробаў - актуальная праблема, якую трэба вырашыць. Па-другое, экстракцыя бялку мікраарганізмаў павінна ўлічваць адрозненні, абумоўленыя структурнай неаднастайнасцю розных бактэрый. Узоры макрапратэомаў у дыяпазоне слядоў таксама патрабуюць спецыяльных метадаў папярэдняй апрацоўкі.
Што тычыцца прыбораў мас-спектраметрыі, асноўныя прыборы мас-спектраметрыі зведалі пераход ад мас-спектрометраў на аснове аналізатараў масы Orbitrap, такіх як LTQ-Orbitrap і Q Exactive, да мас-спектрометраў на аснове аналізатараў масы часу пралёта рухомасці іёнаў, такіх як timsTOF Pro . Серыя прыбораў timsTOF з інфармацыяй аб памерах рухомасці іёнаў мае высокую дакладнасць выяўлення, нізкі мяжа выяўлення і добрую паўтаральнасць. Яны паступова сталі важнымі інструментамі ў розных галінах даследаванняў, якія патрабуюць мас-спектраметрычнага выяўлення, такіх як пратэом, метапратэом і метабалом аднаго віду. Варта адзначыць, што на працягу доўгага часу дынамічны дыяпазон прыбораў мас-спектраметрыі абмяжоўваў глыбіню бялковага пакрыцця даследаванняў метапратэомаў. У будучыні прыборы мас-спектраметрыі з большым дынамічным дыяпазонам змогуць палепшыць адчувальнасць і дакладнасць ідэнтыфікацыі бялку ў метапратэомах.
Для збору дадзеных мас-спектраметрыі, хоць рэжым збору дадзеных DIA быў шырока прыняты ў пратэоме аднаго віду, большасць сучасных аналізаў макрапратэомаў па-ранейшаму выкарыстоўвае рэжым збору дадзеных DDA. Рэжым збору даных DIA можа цалкам атрымаць інфармацыю аб фрагментах іёнаў узору, і ў параўнанні з рэжымам збору даных DDA, ён можа цалкам атрымаць інфармацыю пра пептыды ўзору макрапратэома. Аднак з-за высокай складанасці дадзеных DIA аналіз дадзеных макропротеома DIA па-ранейшаму сутыкаецца з вялікімі цяжкасцямі. Чакаецца, што развіццё штучнага інтэлекту і глыбокага навучання павысіць дакладнасць і паўнату аналізу даных DIA.
У аналізе даных метапратэёмікі адным з ключавых этапаў з'яўляецца стварэнне базы дадзеных паслядоўнасці бялкоў. Для папулярных абласцей даследаванняў, такіх як кішачная флора, можна выкарыстоўваць базы дадзеных кішачных мікробаў, такія як IGC і HMP, і былі дасягнуты добрыя вынікі ідэнтыфікацыі. Для большасці іншых аналізаў метапратэомікі найбольш эфектыўнай стратэгіяй пабудовы базы дадзеных па-ранейшаму з'яўляецца стварэнне базы дадзеных паслядоўнасці бялку для канкрэтнага ўзору на аснове дадзеных метагеномнага секвенирования. Для ўзораў мікробнай супольнасці з высокай складанасцю і шырокім дынамічным дыяпазонам неабходна павялічыць глыбіню секвенирования, каб павялічыць ідэнтыфікацыю відаў з нізкай колькасцю, тым самым паляпшаючы ахоп базы дадзеных паслядоўнасці бялку. Пры адсутнасці дадзеных паслядоўнасці для аптымізацыі агульнадаступнай базы дадзеных можна выкарыстоўваць метад ітэрацыйнага пошуку. Аднак ітэрацыйны пошук можа паўплываць на кантроль якасці FDR, таму вынікі пошуку неабходна старанна правяраць. Акрамя таго, дастасавальнасць традыцыйных мадэляў кантролю якасці FDR у аналізе метапратэёмікі ўсё яшчэ варта вывучыць. Што тычыцца стратэгіі пошуку, стратэгія гібрыднай спектральнай бібліятэкі можа палепшыць глыбіню ахопу метапратэёмікі DIA. У апошнія гады прагназуемая спектральная бібліятэка, створаная на аснове глыбокага навучання, паказала высокую прадукцыйнасць у пратэёміцы DIA. Аднак базы дадзеных метапратэомаў часта ўтрымліваюць мільёны бялковых запісаў, што прыводзіць да вялікага маштабу прагназуемых спектральных бібліятэк, спажывае шмат вылічальных рэсурсаў і прыводзіць да вялікай прасторы пошуку. Акрамя таго, падабенства паміж бялковымі паслядоўнасцямі ў метапратэомах моцна адрозніваецца, што ўскладняе забеспячэнне дакладнасці мадэлі прагназавання спектральнай бібліятэкі, таму прагназаваныя спектральныя бібліятэкі не знайшлі шырокага выкарыстання ў метапратэоміцы. Акрамя таго, неабходна распрацаваць новыя стратэгіі высновы пра бялок і анатацыі класіфікацыі для прымянення да метапратэёмічнага аналізу вельмі падобных паслядоўнасцей бялкоў.
Такім чынам, як новая тэхналогія даследавання мікрабіёмаў, тэхналогія метапратэёмікі дасягнула значных вынікаў у даследаваннях, а таксама мае велізарны патэнцыял развіцця.
Час публікацыі: 30 жніўня 2024 г