VSE knjižnice (vzajemna bibliografsko-kataložna baza podatkov COBIB.SI)
  • Metoda hierarhične večznačne klasifikacije na osnovi ekstrakcije značilnic s tekstovno analizo mikrobiotskih podatkov : doktorska disertacija
    Brezočnik, Lucija
    Zanesljiva identifikacija kompleksnih vsebinskih struktur v primerih, kjer posamezni primerki podatkovnega nabora niso homogeni, pač pa združujejo informacije več virov, predstavlja enega izmed ... ključnih metodoloških izzivov sodobne podatkovne analitike. Relativno enostavna je namreč naloga, kjer je določen primerek homogen in ga z uporabo večrazredne klasifikacije znamo relativno preprosto razvrstiti v enega izmed ponujenih razredov. Kompleksnost pa se drastično poveča, ko se v istem primerku skriva več virov. V tem primeru osnovne metode analize ne zadostujejo več in potrebujemo naprednejše pristope, ki so sposobni razbrati soobstoj več razredov oziroma oznak, kar je tudi domena večznačne klasifikacije. V predloženi doktorski disertaciji obravnavamo omenjeni problem na področju metagenomike, ki med drugim omogoča raziskovanje mikrobiote, raznolike skupnosti bakterij in drugih mikroorganizmov v določenem okolju. Z naprednimi tehnikami sekvenciranja iz njih pridobimo zaporedja DNK celotne mikrobne združbe, ki jih lahko opišemo kot izjemno dolga besedila, zapisana z abecedo štirih nukleotidov: A, T, G in C. Naš cilj je v teh besedilih poiskati t. i. označevalne gene, ki so izključno ali močno povezani z gostiteljem. V ta namen smo na podlagi optimizacijskih pristopov in domenskih pravil predlagali metodo ekstrakcije značilnic, temelječo na osnovi k-merov, tj. krajših delov DNK. Pristop na osnovi k-merov se je izkazal za zelo učinkovitega, zato smo ga uporabili tudi pri sintetičnem generiranju vzorcev mikrobnih oziroma mikrobiotskih podatkov. Metoda temelji na pripravi profilov k-merov in na nanje osnovanih grafih prehodov. Ker smo v doktorski disertaciji analizirali lokacijsko specifične vzorce, smo morali njihov manjši nabor čistih vzorcev ustrezno razširiti. Še več, sintetično smo razširili tudi nabor mešanih vzorcev, kar predstavlja še večji izziv v realnih okoljih. Obe predlagani metodi sta se združili v konceptualno najzahtevnejšem delu doktorske naloge, predlagani metodi hierarhične večznačne klasifikacije na osnovi ekstrakcije značilnic, imenovani MLB. Z njo smo na osnovi vhodnih podatkov, tj. čistih ali sintetično ustvarjenih vzorcev, napovedovali deleže gostiteljev v mešanih mikrobnih vzorcih. Rezultate metode MLB smo primerjali s tistimi, pridobljenimi z orodjem SourceTracker, vodilnim orodjem za natančno identifikacijo in kvantifikacijo gostiteljev mikrobov v mešanih vzorcih. Metodi smo ovrednotili z uveljavljenimi metrikami na področju večznačne klasifikacije, ki razkrivajo, da metoda MLB učinkovito rešuje problem določitve gostiteljev in njihovih deležev ter poda primerljive, večinoma pa boljše rezultate kot orodje SourceTracker.
    Vrsta gradiva - disertacija ; neleposlovje za odrasle
    Založništvo in izdelava - Maribor : [L. Brezočnik], 2025
    Jezik - slovenski
    COBISS.SI-ID - 253974787

Knjižnica/institucija Kraj Akronim Za izposojo Druga zaloga
Knjižnica tehniških fakultet, Maribor Maribor KTFMB v čitalnico 1 izv.
Narodna in univerzitetna knjižnica, Ljubljana Ljubljana NUK v čitalnico 1 izv.
ni za izposojo 1 izv.
Univerzitetna knjižnica Maribor Maribor UKM v čitalnico 1 izv.
loading ...
loading ...
loading ...