Az MTA Rényi Alfréd Matematikai Kutatóintézet 2004. szeptemberében indította el az országos
Bioninformatika Szemináriumot, elsösorban azzal a céllal, hogy az országban (és esetleg azon kívül)
élö és dolgozó kutatók, oktatók és alkalmazók, akik bioniformatikával foglalkoznak, megismerkedjenek egymással.
A szeminárium látogatóinak kezdeményezésére alakult meg 2006. december 8-án a Magyar Bioinformatikai Társaság.
A szeminárium helye a Rényi Intézet
(Budapest, V. ker. Reáltanoda u. 13-15.,
térkép) nagy elöadóterme.
Következő előadásaink
2007. október 3. 10:00-16:00
A Magyar bioinformatikai társaság 2007. évi tudományos ülésszaka
10:00-11:00 ifj. Tusnády Gábor
TOPDB: Transzmembrán fehérjék topológia adatbázisa
A transzmembrán fehérjék fontos szerepet játszanak az élő szervezet
szinte valamennyi területén. Részt vesznek az anyagcsere folyamatokban,
az információ áramlásban valamint az energia termelő folyamatokban. Míg
a genom szekvenálások által megismert szekvencia adatok azt mutatják,
hogy az összes fehérje mintegy egy negyede transzmembrán fehérje, alig
néhány száz transzmembrán fehérje szerkezetét ismerjük. Ezen fehérjék
szerkezetéről különböző fizikai kémiai kísérleti eljárások segítségével
is kaphatunk információt. Ezeknek az adatoknak az összegyűjtéséről és
bioinformatikai módszerekkel való feldolgozásáról számolok be ebben az
előadásban.
11:00-12:00 Prohászka Zoltán
Orvosbiológiai adatbázisok kölcsönhatásokra
kiterjedő elemzése
12:00-13:00 Ebédszünet
13:00-14:00 Kertész-Farkas Attila
Protein databases and similarity measures for protein classification
Abstract
Predicting the function or structure of proteins from their sequence is
perhaps the most important task in genome sequencing today. This problem
is approached either by inference based on sequence similarity, or by
machine-learning based classification algorithms such as support vector
machines or artificial neural networks. In the first part of the
presentation I will talk about benchmark datasets and similarity
measures used in protein classification. The second part of my
presentation is an introduction to the use of the
kolmogorov-compexity-based distance measures in protein sequence
comparison. This measure is well-known from information theory (also
known as "universal similarity metric" or "information distance") .
- [1] Sonego, P, Pacurar, M., Dhir, S., Kertész-Farkas, A, Kocsor, A.,
Gáspári, Z., Leunissen, J.A.M., and Pongor, S. (2007) A Protein
Classification Benchmark collection for machine learning, Nucl. Acids.
Res., 35, D232-236
-
[2] Kertesz-Farkas A, Dhir S, Sonego P, Pacurar M, Netoteia S, Nijveen H,
Kuzniar A, Leunissen JA, Kocsor A, Pongor S. (2007) Benchmarking protein
classification algorithms via supervised cross-validation. J Biochem
Biophys Methods. in press.
-
[3] Kocsor, A., Kertész-Farkas, A., Kaján, L. and Pongor, S. (2006)
Application of compression-based distance measures to protein sequence
classification: a methodological study. Bioinformatics, 22, 407-412
14:00-15:00 Csürös Miklós
Evolution of eukaryotic exon-intron organization
Abstract:
A hallmark of eukaryotic gene organization is the presence of
spliceosomal introns, which are removed from the mRNA transcripts
before translation intro proteins. Puzzling questions about the
origins, evolution and function of introns can now be answered at
least partially by using complete annotated genome sequences. I will
review some recent results on intron evolution, including
computational challenges and biological insights. Most notably, a
picture unfolding from recent large-scale analyses show that introns
are specific to Eukaryotes, were abundant at a comparable level to
humans in early organisms, and numerous lineages underwent massive
intron losses, whereas intron gains were prevalent only on deep
branches.
15:15-16:15 Martin Tompa
Which Portions of Whole-Genome Multiple Alignments
Are Reliable?
Whole-genome alignments are invaluable for comparative genomics. Before doing any comparative analysis on a region of interest, one must have confidence in that region's alignment. This talk presents a methodology to measure the accuracy of arbitrary regions of these alignments. We have applied it to the UCSC Genome Browser's 17-vertebrate alignment. We identify 9.7% (21 Mbp) of the human chromosome 1 alignment as suspiciously aligned. We present independent evidence that many of these suspicious regions represent misalignments. This is joint work with Amol Prakash.
2007. május 30. 13:00
Székely László
Evolúciós fák rekonstrukciója - egy matematikus szemével
A biológusok morfológikus karakterekbõl, mutációkból, a génsorrend
valtozásaiból, és számos egyénb adatból probálják meghatározni, hogy
milyen lehetett nehány - vagy éppen sok - vizsgált faj (vagy egyéb
taxonómai egység) evoluciós fája.
Sok módszer és sok adatféleség van, es ezek nem adják ugyanazt az
eredményt. Ezért szükséges a módszerek elemzése: biológia, statisztika,
matematika, és számítastudomány természetesen szükséges, de ezen a területen
az ismeretelméleti problémák is megkerülhetetlenek.
Milyen módszerek kellenenek, milyen módszerek vannak, és milyen
nyitott matematikai problemák vannak - errõl fog szólni az elõadás.
Czabarka Éva
Egy modell adatbázisokban való bootstrap-re
A bioinformatika alkalmazói gyakran kerülnek szembe a következõ
kérdéssel: két algoritmus közül melyik keres hatékonyabban
egy adatbázisban (pl. a BLAST éves új verziója kiadásánál).
A kérdés eldöntésére számos információelméleti
mérték áll rendelkezésre. Egy új algoritmus
számos költséggel járhat (kódfenntartás, futásidõ, stb.),
ezért célszerü a mért különbségekhez statisztikai szignifikanciát
is rendelni. Ezt a szignifikanciát leggyakrabban a bootstrap
alkalmazásával határozzák meg. Mindeddig azonban nem volt modell arra,
hogy az adatbázis bootstrap milyen eloszlást probál modellezni.
Ebben az elõadásban leírunk egy egyszerü és természetes modellt
ami megválaszolja ezt a kérdést. A következõk bizonyithatók az
adott modellel: a ROC[n] érték eloszlása normális, és a
bootstrappelt érték eloszlása ehhez az eloszláshoz tart.
Az eloszlás várható értékére és szorására konnyen számolható
kozelítõ képlet van.
Közös munka John Spouge-dzsal.