Краткий экскурс в историю становления биоинформатики презентация

Содержание

Слайд 2

Краткий экскурс в историю становления биоинформатики

Для биолога
Для биоинформатика

Ряд Нобелевских премий 1950-1970

Краткий экскурс в историю становления биоинформатики Для биолога Для биоинформатика Ряд Нобелевских премий 1950-1970

Слайд 3

Альфа-субъединица АТФ-синтетазы

Лайнус Полинг

Нобелевская премия по химии 1954

Вторичная структура – альфа-спираль и бета-лист

Белки

- текст, написанный на алфавите
Из 20 букв

Альфа-субъединица АТФ-синтетазы Лайнус Полинг Нобелевская премия по химии 1954 Вторичная структура – альфа-спираль

Слайд 4

Нобелевская премия по физиологии и медицине 1962

Вторичная структура ДНК - спираль

Лайнус Полинг -

Нобелевская премия мира 1962 г.

Геном - текст, написанный на алфавите
из 4 букв

Нобелевская премия по физиологии и медицине 1962 Вторичная структура ДНК - спираль Лайнус

Слайд 5

1968 - Нобелевская премия по физиологии и медицине

Ниренберг, Хорана,
Холли

Соответствие между
4-буквенным и

20-буквенным алфавитами

1968 - Нобелевская премия по физиологии и медицине Ниренберг, Хорана, Холли Соответствие между

Слайд 6

Рождение технологий

Рождение технологий

Слайд 7

1977 год

Нобелевская премия по химии 1980 г.

Метод секвенирования Сэнгера

The Wellcome Trust Sanger Institute,

1992

1992 г

Начал с получения полной аминокислотной последовательности инсулина в 1951-52

1977 год Нобелевская премия по химии 1980 г. Метод секвенирования Сэнгера The Wellcome

Слайд 8

Первый отсеквенированный геном

1995 г.
бактерия Haemophilus influenzae –гемофильная палочка или палочка Пфейфера

5 Mb

Первый отсеквенированный геном 1995 г. бактерия Haemophilus influenzae –гемофильная палочка или палочка Пфейфера 5 Mb

Слайд 9

Human Genome Project

Started in 1990
Finished 2001/2003
Sanger Sequencing

3 Gb

Human Genome Project Started in 1990 Finished 2001/2003 Sanger Sequencing 3 Gb

Слайд 10

Слайд 11

Next Generation Sequencing, or NextGenSeq, or NGS

Next Generation Sequencing, or NextGenSeq, or NGS

Слайд 12

Слайд 13

Слайд 14

NextGen Sequencing Revolution

Human genome –
Volumes, double-sided,
4pt, ~ 43,000 chars per

page

To print is more expensive than to sequence

NextGen Sequencing Revolution Human genome – Volumes, double-sided, 4pt, ~ 43,000 chars per

Слайд 15

Next Generation Sequencing

DNA-seq
RNA-seq
Chip-Seq
MNase-Seq
Hi-C

Massive parallel sequencing
1 million to 43 billion short reads per

instrument run

Next Generation Sequencing DNA-seq RNA-seq Chip-Seq MNase-Seq Hi-C Massive parallel sequencing 1 million

Слайд 16

Data Accumulation

Data Accumulation

Слайд 17

ENCODE: Encyclopedia of DNA Elements

And many more

ENCODE: Encyclopedia of DNA Elements And many more

Слайд 18

Relationship of figure panels highlights data set dimensions

Relationship of figure panels highlights data set dimensions

Слайд 19

Machine-Learning for cracking the codes

Machine-Learning for cracking the codes

Слайд 20

Nature 2006

Nature 2006

Слайд 21

Nature 2010

Nature 2010

Слайд 22

Epigenetic code

Nature 2010

Epigenetic code Nature 2010

Слайд 23

2005-2015 много статей по распознаванию функциональных элементов генома методами “классического” машинного обучения

2005-2015 много статей по распознаванию функциональных элементов генома методами “классического” машинного обучения

Слайд 24

Deep Learning

Deep Learning

Слайд 25

Convolution Neural Network

Convolution Neural Network

Слайд 26

DNA as picture?

Nature Methods volume 12, pages 931–934 (2015)

Nature 2015

DNA as picture? Nature Methods volume 12, pages 931–934 (2015) Nature 2015

Слайд 27

nature biotechnology 2015

DeepBind

nature biotechnology 2015 DeepBind

Слайд 28

Слайд 29

Слайд 30

Bioinformatics, 2016

Not just
one hot encoding

Bioinformatics, 2016 Not just one hot encoding

Слайд 31

Bioinformatics, 2018,

Plus
structure
information

Bioinformatics, 2018, Plus structure information

Слайд 32

Filter information
extraction

Filter information extraction

Слайд 33

Bioinformatics,
2018

The Inception architecture
of GoogLeNet

Bioinformatics, 2018 The Inception architecture of GoogLeNet

Слайд 34

Слайд 35

Слайд 36

2019 - 2024

Take the best solution from AI several years later it was

introduced in non-biological area
image recognition
language recognition
language translation (RNN)
Apply it to the DNA

2019 - 2024 Take the best solution from AI several years later it

Слайд 37

DNA Computing

DNA Computing

Слайд 38

Basic Idea:
Perform molecular biology experiment to find solution to math problem.

Basic Idea: Perform molecular biology experiment to find solution to math problem.

Слайд 39

HAMILTONIAN PATH PROBLEM

Given a network of nodes and directed connections between them, is

there a path through the network that begins with the start node and concludes with the end node visiting each node only once (“Hamiltonian path")?
“Does a Hamiltonian path exist, or not?”

HAMILTONIAN PATH PROBLEM Given a network of nodes and directed connections between them,

Слайд 40

Detroit

Boston

Chicago

Atlanta

Start city

End city

Hamiltonian path does exist!

Detroit Boston Chicago Atlanta Start city End city Hamiltonian path does exist!

Слайд 41

Detroit

Boston

Chicago

Atlanta

End city

Start city

Hamiltonian path does not exist!

Detroit Boston Chicago Atlanta End city Start city Hamiltonian path does not exist!

Слайд 42

DNA Polymerase

- Protein that produces complementary DNA strand
- A -> T, T ->

A, C -> G, G -> C
- Enables DNA to reproduce

DNA Polymerase - Protein that produces complementary DNA strand - A -> T,

Слайд 43

Polymerase in Action

The “bio” nano-machine:
hops onto DNA strand
slides along
reads each base
writes its complement

onto new strand

Polymerase in Action The “bio” nano-machine: hops onto DNA strand slides along reads

Слайд 44

Слайд 45

DNA encoding of city-network

DNA encoding of city-network

Слайд 46

Detroit

Boston

Chicago

Atlanta

Start city

End city

Atlanta-Boston

Boston-Chicago

Chicago*

Chicago-Detroit

Detroit*

Atlanta*

Boston*

Detroit Boston Chicago Atlanta Start city End city Atlanta-Boston Boston-Chicago Chicago* Chicago-Detroit Detroit* Atlanta* Boston*

Слайд 47

Detroit

Boston

Chicago

Atlanta

Start city

End city

Boston-Atlanta

Atlanta-Detroit

Detroit*

Boston*

Atlanta*

Detroit Boston Chicago Atlanta Start city End city Boston-Atlanta Atlanta-Detroit Detroit* Boston* Atlanta*

Слайд 48

Ingredients and tools needed:
- DNA strands that encode city names and connections

between them
- Ligase, water, salt, other ingredients
- Polymerase chain reaction (PCR) set
- Gel electrophoresis tool (that filters out non-solution strands)

DNA Experiment Set-up

Ingredients and tools needed: - DNA strands that encode city names and connections

Слайд 49

Deepthi Bollu

How Dense is the Information Storage?

Nucleotides are spaced at 0.35 nm along

DNA
data density is over a 1 mln Gbits/inch
7 Gbits/inch in typical high performance HDD.

Deepthi Bollu How Dense is the Information Storage? Nucleotides are spaced at 0.35

Слайд 50

Deepthi Bollu

How enormous is the parallelism?

A test tube of DNA can contain trillions

of strands. Each operation on a test tube of DNA is carried out on all strands in the tube in parallel !

Deepthi Bollu How enormous is the parallelism? A test tube of DNA can

Слайд 51

Deepthi Bollu

How extraordinary is the energy efficiency?

Adleman figured his computer was running
2

x 1019 operations per joule.

Deepthi Bollu How extraordinary is the energy efficiency? Adleman figured his computer was

Слайд 52

Сomputer that ‘grows as it computes’

2017

Сomputer that ‘grows as it computes’ 2017

Слайд 53

“Here, we demonstrate the first physical design of an NUTM”

Nondeterministic universal Turing

machine (NUTM)

“Here, we demonstrate the first physical design of an NUTM” Nondeterministic universal Turing machine (NUTM)

Слайд 54

Nondeterministic universal Turing machine (NUTM)

Electronic computers need to choose which path to follow

first.
DNA computer doesn’t need to choose, it follows both paths at the same time.
Quantum computers can also follow both paths, but only if the maze has certain symmetries, which greatly limits their use.

Nondeterministic universal Turing machine (NUTM) Electronic computers need to choose which path to

Слайд 55

A universal Thue system.

Аксель Туэ (Axel Thue)
1863-1922

Turing machines can be viewed

as rewrite systems

The application of a Thue rule to a string therefore produces a new string — equivalent to change of state in a UTM.

A universal Thue system. Аксель Туэ (Axel Thue) 1863-1922 Turing machines can be

Слайд 56

DNA computing.

DNA computing.

Слайд 57

Implementation of a DNA NUTM

14 paralleling executing processors (one each for both

direction of the seven Thue rules) and a mixing vessel.

Implementation of a DNA NUTM 14 paralleling executing processors (one each for both

Слайд 58

“As DNA molecules are very small a desktop computer could potentially utilize more

processors than all the electronic computers in the world combined - and therefore outperform the world’s current fastest supercomputer, while consuming a tiny fraction of its energy.”

“As DNA molecules are very small a desktop computer could potentially utilize more

Слайд 59

Слайд 60

Human disease-gene networks

Human disease-gene networks

Слайд 61

Рэй Курцвейл

Рэй Курцвейл

Слайд 62

2020 – Персональные компьютеры достигнут вычислительной мощности, сравнимой с человеческим мозгом.

2028 – Солнечная

энергия станет настолько дешевой и распространенной, что будет удовлетворять всей суммарной энергетической потребности человечества.

2033 – Самоуправляемые автомобили заполнят дороги.

2020 – Персональные компьютеры достигнут вычислительной мощности, сравнимой с человеческим мозгом. … 2028

Слайд 63

2036 – Используя подход к биологии, как к программированию, человечеству впервые удастся запрограммировать

клетки для лечения болезней, а использование 3D-принтеров позволит выращивать новые ткани и органы.
2037 – Гигантский прорыв в понимании тайны человеческого мозга. Некоторые из алгоритмов будут расшифрованы и включены в нейронные сети компьютеров.

2036 – Используя подход к биологии, как к программированию, человечеству впервые удастся запрограммировать

Слайд 64

Нобелевская премия по физиологии и медицине

203X год - за открытие алгоритмов работы генома


203X год – за программирование клеток

Нобелевская премия по физиологии и медицине 203X год - за открытие алгоритмов работы

Имя файла: Краткий-экскурс-в-историю-становления-биоинформатики.pptx
Количество просмотров: 22
Количество скачиваний: 0