Краткий экскурс в историю становления биоинформатики презентация


Слайд 2

Краткий экскурс в историю становления биоинформатики Для биолога Для биоинформатика Ряд Нобелевских премий 1950-1970

Краткий экскурс в историю становления биоинформатики

Для биолога
Для биоинформатика

Ряд Нобелевских

премий 1950-1970
Слайд 3

Альфа-субъединица АТФ-синтетазы Лайнус Полинг Нобелевская премия по химии 1954 Вторичная

Альфа-субъединица АТФ-синтетазы

Лайнус Полинг

Нобелевская премия по химии 1954

Вторичная структура – альфа-спираль

и бета-лист

Белки - текст, написанный на алфавите
Из 20 букв

Слайд 4

Нобелевская премия по физиологии и медицине 1962 Вторичная структура ДНК

Нобелевская премия по физиологии и медицине 1962

Вторичная структура ДНК - спираль


Полинг - Нобелевская премия мира 1962 г.

Геном - текст, написанный на алфавите
из 4 букв

Слайд 5

1968 - Нобелевская премия по физиологии и медицине Ниренберг, Хорана,

1968 - Нобелевская премия по физиологии и медицине

Ниренберг, Хорана,

Соответствие между

4-буквенным и 20-буквенным алфавитами
Слайд 6

Рождение технологий

Рождение технологий

Слайд 7

1977 год Нобелевская премия по химии 1980 г. Метод секвенирования

1977 год

Нобелевская премия по химии 1980 г.

Метод секвенирования Сэнгера

The Wellcome Trust

Sanger Institute, 1992

1992 г

Начал с получения полной аминокислотной последовательности инсулина в 1951-52

Слайд 8

Первый отсеквенированный геном 1995 г. бактерия Haemophilus influenzae –гемофильная палочка или палочка Пфейфера 5 Mb

Первый отсеквенированный геном

1995 г.
бактерия Haemophilus influenzae –гемофильная палочка или палочка


5 Mb

Слайд 9

Human Genome Project Started in 1990 Finished 2001/2003 Sanger Sequencing 3 Gb

Human Genome Project

Started in 1990
Finished 2001/2003
Sanger Sequencing

3 Gb

Слайд 10

Слайд 11

Next Generation Sequencing, or NextGenSeq, or NGS

Next Generation Sequencing, or NextGenSeq, or NGS

Слайд 12

Слайд 13

Слайд 14

NextGen Sequencing Revolution Human genome – Volumes, double-sided, 4pt, ~

NextGen Sequencing Revolution

Human genome –
Volumes, double-sided,
4pt, ~ 43,000

chars per page

To print is more expensive than to sequence

Слайд 15

Next Generation Sequencing DNA-seq RNA-seq Chip-Seq MNase-Seq Hi-C Massive parallel

Next Generation Sequencing


Massive parallel sequencing
1 million to 43 billion short

reads per instrument run
Слайд 16

Data Accumulation

Data Accumulation

Слайд 17

ENCODE: Encyclopedia of DNA Elements And many more

ENCODE: Encyclopedia of DNA Elements

And many more

Слайд 18

Relationship of figure panels highlights data set dimensions

Relationship of figure panels highlights data set dimensions

Слайд 19

Machine-Learning for cracking the codes

Machine-Learning for cracking the codes

Слайд 20

Nature 2006

Nature 2006

Слайд 21

Nature 2010

Nature 2010

Слайд 22

Epigenetic code Nature 2010

Epigenetic code

Nature 2010

Слайд 23

2005-2015 много статей по распознаванию функциональных элементов генома методами “классического” машинного обучения

2005-2015 много статей по распознаванию функциональных элементов генома методами “классического” машинного обучения

Слайд 24

Deep Learning

Deep Learning

Слайд 25

Convolution Neural Network

Convolution Neural Network

Слайд 26

DNA as picture? Nature Methods volume 12, pages 931–934 (2015) Nature 2015

DNA as picture?

Nature Methods volume 12, pages 931–934 (2015)

Nature 2015

Слайд 27

nature biotechnology 2015 DeepBind

nature biotechnology 2015


Слайд 28

Слайд 29

Слайд 30

Bioinformatics, 2016 Not just one hot encoding

Bioinformatics, 2016

Not just
one hot encoding

Слайд 31

Bioinformatics, 2018, Plus structure information

Bioinformatics, 2018,


Слайд 32

Filter information extraction

Filter information

Слайд 33

Bioinformatics, 2018 The Inception architecture of GoogLeNet


The Inception architecture
of GoogLeNet

Слайд 34

Слайд 35

Слайд 36

2019 - 2024 Take the best solution from AI several

2019 - 2024

Take the best solution from AI several years later

it was introduced in non-biological area
image recognition
language recognition
language translation (RNN)
Apply it to the DNA
Слайд 37

DNA Computing

DNA Computing

Слайд 38

Basic Idea: Perform molecular biology experiment to find solution to math problem.

Basic Idea:
Perform molecular biology experiment to find solution to math

Слайд 39

HAMILTONIAN PATH PROBLEM Given a network of nodes and directed


Given a network of nodes and directed connections between

them, is there a path through the network that begins with the start node and concludes with the end node visiting each node only once (“Hamiltonian path")?
“Does a Hamiltonian path exist, or not?”
Слайд 40

Detroit Boston Chicago Atlanta Start city End city Hamiltonian path does exist!





Start city

End city

Hamiltonian path does exist!

Слайд 41

Detroit Boston Chicago Atlanta End city Start city Hamiltonian path does not exist!





End city

Start city

Hamiltonian path does not exist!

Слайд 42

DNA Polymerase - Protein that produces complementary DNA strand -

DNA Polymerase

- Protein that produces complementary DNA strand
- A -> T,

T -> A, C -> G, G -> C
- Enables DNA to reproduce
Слайд 43

Polymerase in Action The “bio” nano-machine: hops onto DNA strand

Polymerase in Action

The “bio” nano-machine:
hops onto DNA strand
slides along
reads each base

its complement onto new strand
Слайд 44

Слайд 45

DNA encoding of city-network

DNA encoding of city-network

Слайд 46

Detroit Boston Chicago Atlanta Start city End city Atlanta-Boston Boston-Chicago Chicago* Chicago-Detroit Detroit* Atlanta* Boston*





Start city

End city








Слайд 47

Detroit Boston Chicago Atlanta Start city End city Boston-Atlanta Atlanta-Detroit Detroit* Boston* Atlanta*





Start city

End city






Слайд 48

Ingredients and tools needed: - DNA strands that encode city

Ingredients and tools needed:
- DNA strands that encode city names

and connections between them
- Ligase, water, salt, other ingredients
- Polymerase chain reaction (PCR) set
- Gel electrophoresis tool (that filters out non-solution strands)

DNA Experiment Set-up

Слайд 49

Deepthi Bollu How Dense is the Information Storage? Nucleotides are

Deepthi Bollu

How Dense is the Information Storage?

Nucleotides are spaced at 0.35

nm along DNA
data density is over a 1 mln Gbits/inch
7 Gbits/inch in typical high performance HDD.
Слайд 50

Deepthi Bollu How enormous is the parallelism? A test tube

Deepthi Bollu

How enormous is the parallelism?

A test tube of DNA can

contain trillions of strands. Each operation on a test tube of DNA is carried out on all strands in the tube in parallel !
Слайд 51

Deepthi Bollu How extraordinary is the energy efficiency? Adleman figured

Deepthi Bollu

How extraordinary is the energy efficiency?

Adleman figured his computer was

2 x 1019 operations per joule.
Слайд 52

Сomputer that ‘grows as it computes’ 2017

Сomputer that ‘grows as it computes’


Слайд 53

“Here, we demonstrate the first physical design of an NUTM” Nondeterministic universal Turing machine (NUTM)

“Here, we demonstrate the first physical design of an NUTM”


universal Turing machine (NUTM)
Слайд 54

Nondeterministic universal Turing machine (NUTM) Electronic computers need to choose

Nondeterministic universal Turing machine (NUTM)

Electronic computers need to choose which path

to follow first.
DNA computer doesn’t need to choose, it follows both paths at the same time.
Quantum computers can also follow both paths, but only if the maze has certain symmetries, which greatly limits their use.
Слайд 55

A universal Thue system. Аксель Туэ (Axel Thue) 1863-1922 Turing

A universal Thue system.

Аксель Туэ (Axel Thue)

Turing machines can

be viewed as rewrite systems

The application of a Thue rule to a string therefore produces a new string — equivalent to change of state in a UTM.

Слайд 56

DNA computing.

DNA computing.

Слайд 57

Implementation of a DNA NUTM 14 paralleling executing processors (one

Implementation of a DNA NUTM

14 paralleling executing processors (one each

for both direction of the seven Thue rules) and a mixing vessel.
Слайд 58

“As DNA molecules are very small a desktop computer could

“As DNA molecules are very small a desktop computer could potentially

utilize more processors than all the electronic computers in the world combined - and therefore outperform the world’s current fastest supercomputer, while consuming a tiny fraction of its energy.”
Слайд 59

Слайд 60

Human disease-gene networks

Human disease-gene networks

Слайд 61

Рэй Курцвейл

Рэй Курцвейл

Слайд 62

2020 – Персональные компьютеры достигнут вычислительной мощности, сравнимой с человеческим

2020 – Персональные компьютеры достигнут вычислительной мощности, сравнимой с человеческим мозгом.


– Солнечная энергия станет настолько дешевой и распространенной, что будет удовлетворять всей суммарной энергетической потребности человечества.

2033 – Самоуправляемые автомобили заполнят дороги.
Слайд 63

2036 – Используя подход к биологии, как к программированию, человечеству

2036 – Используя подход к биологии, как к программированию, человечеству впервые

удастся запрограммировать клетки для лечения болезней, а использование 3D-принтеров позволит выращивать новые ткани и органы.
2037 – Гигантский прорыв в понимании тайны человеческого мозга. Некоторые из алгоритмов будут расшифрованы и включены в нейронные сети компьютеров.
Слайд 64

Нобелевская премия по физиологии и медицине 203X год - за

Нобелевская премия по физиологии и медицине

203X год - за открытие алгоритмов

работы генома
203X год – за программирование клеток
Имя файла: Краткий-экскурс-в-историю-становления-биоинформатики.pptx
Количество просмотров: 27
Количество скачиваний: 0