Алгоритмы поиска подстроки в строке. Лекция 6 презентация

Июль 30, 2022

Главная
Информатика
Алгоритмы поиска подстроки в строке. Лекция 6

Содержание

2. ПРЯМОЙ ПОИСК самый простой и не эффективный поиск. не проводит анализа подстроки наиболее эффективно работает при
3. ПРЯМОЙ ПОИСК
4. ПРЯМОЙ ПОИСК
5. S – текст, n – количество символов текста O – образ, m – количество символов образа
6. если f==m то УСПЕХ, вернуть i; i++; кц ПРЯМОЙ ПОИСК
7. ПРЯМОЙ ПОИСК Самый неэффективный случай: Оценка времени работы алгоритма O(n*m)
8. Описан Кнутом и Праттом и независимо от них Моррисом Результаты опубликованы совместно в 1977 г. Алгоритм
9. Алгоритм Кнута, Морриса и Пратта для повышения эффективности алгоритма необходимо, чтобы сдвиг на каждом шаге алгоритма
10. обозначим j - количество совпадений, текущего сравнения (j = 3) значение j зависит только от вида
11. Для образа строится таблица сдвигов d[m] d[0] = -1, d[1] = 0 d[j] – длина самой
12. Примеры таблиц сдвигов для различных образов: КМП – АЛГОРИТМ. Предварительная обработка образа
13. m = длина образа о; j = 1, k=0 d[0] = -1; d[1] = 0; Пока
14. Если j==m-1 то закончить выполнение цикла k++; d[j+1]=k; j++; кц КМП – АЛГОРИТМ. Предварительная обработка образа
15. КМП – АЛГОРИТМ. Пример сдвиг на j – d[j]
16. КМП – АЛГОРИТМ. Пример Чем больше совпадений по тексту и меньше совпадений по строке
17. Алгоритм Боуэра-Мура Предложен в 1977
18. Сравнение символов образа с символами текста осуществляется с конца образа Если несовпадение произошло на символе, не
19. Алгоритм Боуэра-Мура Если несовпадение произошло на символе, встречающемся в образе, то выполняется сдвиг на величину, равную
20. Алгоритм Боуэра-Мура Перед работой создается массив d, размерность которого равна размеру использованного алфавита
21. Алгоритм Боуэра-Мура. Пример
22. Алгоритм Боуэра-Мура. Пример Чем меньше совпадений, тем быстрее
23. ПОИСК ПОДСТРОКИ В СТРОКЕ Определить таблицы сдвигов для КМП-алгоритма и алгоритма Боуэра – Мура На каждом
24. ПОИСК В МАССИВЕ Неупорядоченный массив – прямой поиск (O(n)) Упорядоченный массив – бинарный поиск (О(log2 n))
25. Вход – X[n], a 1. F = 0, L = n-1 2. Если F>L то вернуть
26. M =1/2* (F+L) ? F + 1/2*(L-F) Если искомый элемент S: 1/2 ? (S-X[F])/(X[L] – X[F])
27. BST - деревья Binary Search Tree - деревья двоичного поиска. Родитель Правый потомок Левый потомок
28. Правила организации элементов: BST - деревья Родитель Правый потомок Левый потомок Родитель Родитель >
29. BST - деревья Реализация описания узла дерева в Си typedef struct node{ int data; struct node
30. BST - деревья 7
31. BST - деревья 7 9
32. BST - деревья 7 9 8
33. BST - деревья 7 9 8 6
34. BST - деревья 7 9 8 6 3
35. BST - деревья 7 9 8 6 3 5
36. BST - деревья 7 9 8 6 3 5 20
37. BST - деревья 7 9 8 6 3 5 20 15
38. BST - деревья 7 9 8 6 3 5 20 15 18
39. BST - деревья 7 9 8 6 3 5 20 15 18 1
40. BST - деревья 7 9 8 6 3 5 20 15 18 1 2
41. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10
42. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
43. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
44. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
45. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
46. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
47. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
48. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
49. BST - деревья 7 9 8 6 3 5 20 15 18 1 2 10 19
50. Деревья бинарного поиска можно определить таким образом чтобы индексы строились в точности так же… Пример использования
51. Пример использования BST-деревьев для поиска слов Д 1 Деревья бинарного поиска можно определить таким образом чтобы
52. BST – деревья. Алгоритм вставки элемента Вставка (Node ** Root, int key) Если *Root - пустой,
53. BST – деревья. Алгоритм вставки элемента иначе Если key >= *Root->data то Вставка (*Root->right, key) иначе
54. Вставка1 (Node ** Root, int key) Если *Root – пустой то выделить память под *Root *Root
55. Node *temp = *Root; Пока (temp не пуст) нц Если (key>=temp->data) то Если (temp->right - пуст)
57. Скачать презентацию

Слайд 2

ПРЯМОЙ ПОИСК
самый простой и не эффективный поиск.
не проводит анализа подстроки
наиболее эффективно

работает при небольшом количестве совпадений при очередном сравнивании символов образа с символами текста

Слайд 3

ПРЯМОЙ ПОИСК

Слайд 4

ПРЯМОЙ ПОИСК

Слайд 5

S – текст, n – количество символов текста
O – образ, m

– количество символов образа
i =0; j=0;
пока (i j=0; f=0;k=i;
пока (j k++; j++;f++;
кц

ПРЯМОЙ ПОИСК

Слайд 6

если f==m то УСПЕХ, вернуть i;
i++;
кц
ПРЯМОЙ ПОИСК

Слайд 7

ПРЯМОЙ ПОИСК
Самый неэффективный случай:
Оценка времени работы алгоритма O(n*m)

Слайд 8

Описан Кнутом и Праттом и независимо от них Моррисом
Результаты опубликованы совместно

в 1977 г.
Алгоритм назвали КМП-алгоритмом
Временная характеристика алгоритма O(n)

Алгоритм Кнута, Морриса и Пратта

Слайд 9

Алгоритм Кнута, Морриса и Пратта
для повышения эффективности алгоритма необходимо, чтобы сдвиг

на каждом шаге алгоритма был максимально возможным

для вычисления этого сдвига алгоритм разбит на две части:

Слайд 10

обозначим j - количество совпадений, текущего сравнения (j = 3)
значение j

зависит только от вида образа, никак не зависит от текста

КМП - АЛГОРИТМ

1) предварительная обработка подстроки
2) поиск подстроки

Слайд 11

Для образа строится таблица сдвигов d[m]
d[0] = -1, d[1] = 0
d[j]

– длина самой длинной последовательности символов образа, предшествующих j, которая полностью совпадает с началом образа
При j совпадениях образа с текстом можно выполнить сдвиг на j – d[j]

КМП – АЛГОРИТМ. Предварительная обработка образа

Слайд 12

Примеры таблиц сдвигов для различных образов:
КМП – АЛГОРИТМ. Предварительная обработка образа

Слайд 13

m = длина образа о;
j = 1, k=0
d[0] = -1;
d[1] =

0;
Пока j Пока o[k]!=o[j] и j<(m-1) нц
d[j+1] = d[j]; j++; кц

КМП – АЛГОРИТМ. Предварительная обработка образа

Слайд 14

Если j==m-1 то закончить выполнение цикла
k++;
d[j+1]=k;

j++;
кц

КМП – АЛГОРИТМ. Предварительная обработка образа

Слайд 15

КМП – АЛГОРИТМ. Пример
сдвиг на j – d[j]

Слайд 16

КМП – АЛГОРИТМ. Пример
Чем больше совпадений по тексту и меньше

совпадений по строке

Слайд 17

Алгоритм Боуэра-Мура
Предложен в 1977

Слайд 18

Сравнение символов образа с символами текста осуществляется с конца образа
Если несовпадение

произошло на символе, не встречающемся в образе выполняется сдвиг на длину образа минус количество совпадений

Алгоритм Боуэра-Мура

Слайд 19

Алгоритм Боуэра-Мура
Если несовпадение произошло на символе, встречающемся в образе, то выполняется

сдвиг на величину, равную расстоянию от совпавшего символа до конца образа минус количество совпадений
Если получен отрицательный или нулевой сдвиг, осуществляется сдвиг на 1

Слайд 20

Алгоритм Боуэра-Мура
Перед работой создается массив d, размерность которого равна размеру использованного

алфавита

Слайд 21

Алгоритм Боуэра-Мура. Пример

Слайд 22

Алгоритм Боуэра-Мура. Пример
Чем меньше совпадений, тем быстрее

Слайд 23

ПОИСК ПОДСТРОКИ В СТРОКЕ
Определить таблицы сдвигов для КМП-алгоритма и алгоритма Боуэра

– Мура
На каждом шаге выбирать лучший сдвиг

Слайд 24

ПОИСК В МАССИВЕ
Неупорядоченный массив – прямой поиск (O(n))
Упорядоченный массив – бинарный

поиск (О(log2 n))

Слайд 25

Вход – X[n], a
1. F = 0, L = n-1
2. Если

F>L то вернуть -1
3. M =1/2* (F+L)
4. Если X[M] = a, то вернуть M
иначе если X[M]>a то L = M-1
иначе F = M+1
5. Перейти на шаг 2

Бинарный поиск

Слайд 26

M =1/2* (F+L) ? F + 1/2*(L-F)
Если искомый элемент S:
1/2 ?

(S-X[F])/(X[L] – X[F])
Используется алгоритм бинарного поиска

Интерполяционный поиск

Слайд 27

BST - деревья
Binary Search Tree - деревья двоичного поиска.
Родитель
Правый потомок
Левый

потомок

Слайд 28

Правила организации элементов:
BST - деревья
Родитель
Правый потомок
Левый потомок
Родитель <=
Родитель >

Слайд 29

BST - деревья
Реализация описания узла дерева в Си
typedef struct node{
int

data;
struct node *left;
struct node *right;
} Node;

Слайд 30

BST - деревья
7

Слайд 31

BST - деревья
7
9

Слайд 32

BST - деревья
7
9
8

Слайд 33

BST - деревья
7
9
8
6

Слайд 34

BST - деревья
7
9
8
6
3

Слайд 35

BST - деревья
7
9
8
6
3
5

Слайд 36

BST - деревья
7
9
8
6
3
5
20

Слайд 37

BST - деревья
7
9
8
6
3
5
20
15

Слайд 38

BST - деревья
7
9
8
6
3
5
20
15
18

Слайд 39

BST - деревья
7
9
8
6
3
5
20
15
18
1

Слайд 40

BST - деревья
7
9
8
6
3
5
20
15
18
1
2

Слайд 41

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10

Слайд 42

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19

Слайд 43

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17

Слайд 44

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4

Слайд 45

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12

Слайд 46

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13

Слайд 47

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13
11

Слайд 48

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13
11
14

Слайд 49

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13
11
14
16

Слайд 50

Деревья бинарного поиска можно определить таким образом чтобы индексы строились в

точности так же…

Пример использования BST-деревьев для поиска слов

Слайд 51

Пример использования BST-деревьев для поиска слов
Д 1
Деревья бинарного поиска можно определить

таким образом чтобы индексы строились в точности так же…

б 9

п 19

м 26

о 32

т 43

о 49

ч 58

и 64

с 71

в 81

т 83

т 92

ж 43

«точно» 1 – 19 – 43 – 58 – 83
1+1+2+1+5 = 10 сравнений

Слайд 52

BST – деревья. Алгоритм вставки элемента
Вставка (Node ** Root, int key)

Если *Root - пустой, то
выделить память под *Root
*Root -> data = key
*Root -> left = Null
*Root->right = Null
return

Слайд 53

BST – деревья. Алгоритм вставки элемента
иначе
Если key >= *Root->data то

Вставка (*Root->right, key)
иначе
Вставка (*Root->left, key)
конец

Слайд 54

Вставка1 (Node ** Root, int key)
Если *Root – пустой то выделить

память под *Root
*Root -> data = key
*Root -> left = Null
*Root->right = Null
return

BST – деревья. Алгоритм вставки элемента. Не рекурсивная реализация

Слайд 55

Node temp = Root;
Пока (temp не пуст) нц
Если (key>=temp->data) то

Если (temp->right - пуст) то
выделить память под temp->right
temp->right ->left = NULL
temp->right->right = NULL
temp->right->data = key
return
иначе temp = temp->right;

BST – деревья. Алгоритм вставки элемента. Не рекурсивная реализация

Алгоритмы поиска подстроки в строке. Лекция 6 презентация

Содержание

ПРЯМОЙ ПОИСКсамый простой и не эффективный поиск.не проводит анализа подстрокинаиболее эффективно

ПРЯМОЙ ПОИСК

ПРЯМОЙ ПОИСК

S – текст, n – количество символов текстаO – образ, m

если f==m то УСПЕХ, вернуть i; i++;кцПРЯМОЙ ПОИСК

ПРЯМОЙ ПОИСКСамый неэффективный случай: Оценка времени работы алгоритма O(n*m)

Описан Кнутом и Праттом и независимо от них МоррисомРезультаты опубликованы совместно

Алгоритм Кнута, Морриса и Праттадля повышения эффективности алгоритма необходимо, чтобы сдвиг

обозначим j - количество совпадений, текущего сравнения (j = 3)значение j

Для образа строится таблица сдвигов d[m]d[0] = -1, d[1] = 0d[j]

Примеры таблиц сдвигов для различных образов:КМП – АЛГОРИТМ. Предварительная обработка образа

m = длина образа о;j = 1, k=0d[0] = -1;d[1] =

Если j==m-1 то закончить выполнение цикла k++; d[j+1]=k;

КМП – АЛГОРИТМ. Примерсдвиг на j – d[j]

КМП – АЛГОРИТМ. Пример Чем больше совпадений по тексту и меньше

Алгоритм Боуэра-Мура Предложен в 1977

Сравнение символов образа с символами текста осуществляется с конца образаЕсли несовпадение

Алгоритм Боуэра-МураЕсли несовпадение произошло на символе, встречающемся в образе, то выполняется

Алгоритм Боуэра-МураПеред работой создается массив d, размерность которого равна размеру использованного

Алгоритм Боуэра-Мура. Пример

Алгоритм Боуэра-Мура. ПримерЧем меньше совпадений, тем быстрее

ПОИСК ПОДСТРОКИ В СТРОКЕОпределить таблицы сдвигов для КМП-алгоритма и алгоритма Боуэра

ПОИСК В МАССИВЕНеупорядоченный массив – прямой поиск (O(n))Упорядоченный массив – бинарный

Вход – X[n], a1. F = 0, L = n-12. Если

M =1/2* (F+L) ? F + 1/2*(L-F)Если искомый элемент S:1/2 ?

BST - деревьяBinary Search Tree - деревья двоичного поиска. РодительПравый потомокЛевый

Правила организации элементов: BST - деревьяРодительПравый потомокЛевый потомокРодитель <=Родитель >

BST - деревьяРеализация описания узла дерева в Сиtypedef struct node{ int

BST - деревья7

BST - деревья79

BST - деревья798

BST - деревья7986

BST - деревья79863

BST - деревья798635

BST - деревья79863520

BST - деревья7986352015

BST - деревья798635201518

BST - деревья7986352015181

BST - деревья79863520151812

BST - деревья7986352015181210

BST - деревья798635201518121019

BST - деревья79863520151812101917

BST - деревья798635201518121019174

BST - деревья79863520151812101917412

BST - деревья7986352015181210191741213

BST - деревья798635201518121019174121311

BST - деревья79863520151812101917412131114

BST - деревья7986352015181210191741213111416

Деревья бинарного поиска можно определить таким образом чтобы индексы строились в

Пример использования BST-деревьев для поиска словД 1Деревья бинарного поиска можно определить

BST – деревья. Алгоритм вставки элементаВставка (Node ** Root, int key)

BST – деревья. Алгоритм вставки элементаиначе Если key >= *Root->data то

Вставка1 (Node ** Root, int key)Если *Root – пустой то выделить

Node *temp = *Root;Пока (temp не пуст) нц Если (key>=temp->data) то

Похожие презентации

ПРЯМОЙ ПОИСК
самый простой и не эффективный поиск.
не проводит анализа подстроки
наиболее эффективно

S – текст, n – количество символов текста
O – образ, m

если f==m то УСПЕХ, вернуть i;
i++;
кц
ПРЯМОЙ ПОИСК

ПРЯМОЙ ПОИСК
Самый неэффективный случай:
Оценка времени работы алгоритма O(n*m)

Описан Кнутом и Праттом и независимо от них Моррисом
Результаты опубликованы совместно

Алгоритм Кнута, Морриса и Пратта
для повышения эффективности алгоритма необходимо, чтобы сдвиг

обозначим j - количество совпадений, текущего сравнения (j = 3)
значение j

Для образа строится таблица сдвигов d[m]
d[0] = -1, d[1] = 0
d[j]

Примеры таблиц сдвигов для различных образов:
КМП – АЛГОРИТМ. Предварительная обработка образа

m = длина образа о;
j = 1, k=0
d[0] = -1;
d[1] =

Если j==m-1 то закончить выполнение цикла
k++;
d[j+1]=k;

КМП – АЛГОРИТМ. Пример
сдвиг на j – d[j]

КМП – АЛГОРИТМ. Пример
Чем больше совпадений по тексту и меньше

Алгоритм Боуэра-Мура
Предложен в 1977

Сравнение символов образа с символами текста осуществляется с конца образа
Если несовпадение

Алгоритм Боуэра-Мура
Если несовпадение произошло на символе, встречающемся в образе, то выполняется

Алгоритм Боуэра-Мура
Перед работой создается массив d, размерность которого равна размеру использованного

Алгоритм Боуэра-Мура. Пример
Чем меньше совпадений, тем быстрее

ПОИСК ПОДСТРОКИ В СТРОКЕ
Определить таблицы сдвигов для КМП-алгоритма и алгоритма Боуэра

ПОИСК В МАССИВЕ
Неупорядоченный массив – прямой поиск (O(n))
Упорядоченный массив – бинарный

Вход – X[n], a
1. F = 0, L = n-1
2. Если

M =1/2* (F+L) ? F + 1/2*(L-F)
Если искомый элемент S:
1/2 ?

BST - деревья
Binary Search Tree - деревья двоичного поиска.
Родитель
Правый потомок
Левый

Правила организации элементов:
BST - деревья
Родитель
Правый потомок
Левый потомок
Родитель <=
Родитель >

BST - деревья
Реализация описания узла дерева в Си
typedef struct node{
int

BST - деревья
7

BST - деревья
7
9

BST - деревья
7
9
8

BST - деревья
7
9
8
6

BST - деревья
7
9
8
6
3

BST - деревья
7
9
8
6
3
5

BST - деревья
7
9
8
6
3
5
20

BST - деревья
7
9
8
6
3
5
20
15

BST - деревья
7
9
8
6
3
5
20
15
18

BST - деревья
7
9
8
6
3
5
20
15
18
1

BST - деревья
7
9
8
6
3
5
20
15
18
1
2

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13
11

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13
11
14

BST - деревья
7
9
8
6
3
5
20
15
18
1
2
10
19
17
4
12
13
11
14
16

Пример использования BST-деревьев для поиска слов
Д 1
Деревья бинарного поиска можно определить

BST – деревья. Алгоритм вставки элемента
Вставка (Node ** Root, int key)

BST – деревья. Алгоритм вставки элемента
иначе
Если key >= *Root->data то

Вставка1 (Node ** Root, int key)
Если *Root – пустой то выделить

Node temp = Root;
Пока (temp не пуст) нц
Если (key>=temp->data) то