Модель "bag of terms"

 

 

Коллекция
неверных студенческих не-алгоримов и алгоритмов

 

  • когда мы ищем точку, то надо нажать кнопку "пробела", потом "точка" и снова "пробел"

  • При поиске многоточия в поисковой строке я писала три точки - "..."
    при поиске точек - точку и пробел - ". "

  • Посчитать все точки,потом по очереди добавить точки уже их дне. Потом три. В итоге от общего количества отнять и мы узнаем

  • Касаемо неоднозначности в определении числа "точек" и "многоточий", я воспользовалась поиском на странице браузера "chrome" нажатием клавиши "Найти" в диологовом меню настроек браузера. Который с точностью и безошибочно определил количество символов, благодаря символьному вводу в строку поиска. 

  • у меня не возникло никаких трудностей в определении числа точек и многоточий, любой браузер, при качественном поиске может распознать и то, и другое, и определить точное число точек и многоточий , однако , есть нюансы с пробелами между многоточиями, только в этом случае, поиск будет не точен.

  • Алгоритм разрешения неоднозначности в определении числа "точек" и "многоточий" : Ставим одну точку - считаем количество, записываем его, затем ставим три точки(многоточие) - считаем количество. После этого отнимаем от общего числа точек количество многоточий.

  • АЛГОРИТМ РАЗРЕШЕНИЯ НЕОДНОЗНАЧНОСТИ В ОПРЕДЕЛЕНИИ ЧИСЛА " ТОЧЕК" и " МНОГОТОЧИЙ" :
    1.Открыть браузер
    2.Найти нужную вам информацию
    3. Нажать Ctrl+F
    4.В поисковой строке вводим " ..."( три точки БЕЗ ПРОБЕЛОВ!)
    или
       В поисковой строке вводим ". " ( точку, а затем команду ПРОБЕЛ)
    6.Далее браузер определит точное количество и точек, и многоточий.

  • Для поиска количества точек, я использовала запись "точка+пробел". Не знаю, правильный это алгоритм или нет, но надеюсь, что так количество точек найдётся наиболее точно.

  • Для поиска точного числа точек Я использовала следующий алгоритм:
    1) Находим общее количество точек (в поисковой строке пишем ".", без пробелов);
    2)Находим Количество двоеточий (в поисковой строке пишем "..");
    3)От общего количества точек отнимаем количество двоеточий, умноженное на 2 (одно совпадение вида ".." равно двум точкам);
    Искать и минусовать от общего количества точек многоточия ("...") не нужно, т.к. по каким-то причинам, при поиске точек, многоточия не находятся (не выделяются жёлтым цветом), а считаются как отдельный знак препинания (так же как и ",!?;:"). Поиск вида ". " (с пробелом после точки) плох тем, что находятся далеко не все точки. Например, точки в конце абзацев не считаются (не выделяютя).

  • Алгоритм решения неоднозначности в определении числа точек и многоточий:
    поскольку точка является частью знака "многоточие", необходимо найти сначала все точки в тексте, затем все многоточия и отдельно знаки "..". Из числа количества многоточий нужно вычесть число знаков ".." и полученная разница и будет являться точным числом количества точек
    "..."  -  ".."   =  "."
    или же простое уравнение вида
    3х-2х=х 

  • многоточие я искала собственно через"3 точки"
    точку я искала через "точка+пробел"
    но всё равно скорее всего данные не точны, т.к. текст из интернета априори некорректен.

  • Алгоритм решения неоднозначности числа "точек" и "многоточий"
    найти число точек, найти число многоточий
    число многоточий х 3 - число точек

  • алгоритм разрешения неоднозначности в определении числа "точек" и "многоточий": Нужно узнать количество точек, затем 2-х точек и многоточий, далее от количества всех точек отнять количество 2-х точек и многоточий, и тогда мы получим общее количество точек.
    Для поиска точного числа точек Я использовала следующий (своего сочинения) алгоритм:
    1) Находим количество многоточий ("..."). Обозначим его через M;
    2) Находим количество двоеточий (".."). Обозначим его через D;
    3) Находим количество всех точек ("."), входящих и в "..." и в "..". Обозначим это количество через N;
    4) Количество точек нашли по формуле:
    N - (M × 3 +((D -M) ×2)) = КОЛИЧЕСТВО ТОЧЕК

    НАПРИМЕР: Найдём количество точек в данном тексте:
    — Молчите! Не спрашивайте! Вы не стоите... — вскрикнула она вдруг, строго и гневно смотря на него.
    «Так и есть. так и есть.» — повторял он настойчиво про себя.
    — Всё делает! — быстро прошептала она, опять потупившись.
    «Вот и исход! Вот и объяснение исхода!..» — решил он про себя.

  • Если нажать Ctlr+F и ввести в строку поиска ".", "..." и "..", то мы получим:
    M(количество многоточий)=1
    D(количество двоеточий)=2
    N(количество всех точек)=11, тогда количество точек равно:
    11 - (1 × 3 +((2 - 1) ×2)) = 11 - (3 + 2) = 6
    Решение алгоритма неоднозначности числа "." и "..." :

  • 1.Найти число "." ;
    2.Найти число "..." ;
    3.Полученное число "." умножить на 3; 
    4. Отнять число"..." от полученного числа. 
    Это и будет точным числом точек.

  • ....Как отделить точки от многоточий при поиске: когда ищешь точку, нужно в строку поиcка вводить "точку и пробел", т.к. всегда после точки идет пробел, а при многоточии его нет. 

  • число точек х 3 - число многоточий.

  • Возможное решения алгоритма неоднозначности точек и многоточия:
    1) Находим все точки в тексте: Ctrl+F '.'
    2) Находим все многоточия в тексте: Ctrl+F '...'
    3) Умножаем количество многоточий на 3 и вычитаем из общего количества точек
    4) Находим все двоеточия в тексте: Ctrl+F '..' (туда входят все элементы типа: '!..', '?..', '..'; элементы многоточия не определяются по данному запросу)
    5) Умножаем количество двоеточий на 2 и вычитаем из разности которую мы получили на 3 шагу
    6) Получаем необходимый результат
    P. S. Если ваш блокнот даёт другой результат по данному результату,то возможно дело в КОДИРОВКЕ, в которой сохранён текст
    P. P. S. Или у возможно это пиратский блокнот

  • Алгоритм прост, когда ищем точку, после точки пробел не ставим, а при поиске многоточия, ставим 3 точки без пробела. 

  • Наверное все алгоритмы которые я присылала неправильны, потому что это видимо только решение процесса поиска , а не само решение алгоритма, т.е. насколько я поняла это связано с множествами(математикой), тогда для решения алгоритма нужна конкретная формула. Я вижу решение таким:

    1. С помощью поиска определить число повторений для следующих символов «.»,
    «..» и «...» (все искать без пробелов). Обозначить их, например, A (для «.»), B (для
    «..») и C (для «...»).
    2. Число C однозначно определяет количество многоточий в тексте.
    3. Число B представляет собой сумму из удвоенного числа многоточий в тексте (в
    каждом многоточии по две пары точек) и числа знаков с двумя точками, таких как
    «!..» и «?..». Обозначим его как x. Тогда:
    B=X+2C,
    X=B-2C.
    4. Для подсчета числа точек в тексте необходимо из A вычесть 2X, т.к. тут по две
    точки, и 3C, т.к. в каждом многоточии по три точки:
    N=A-2X-3C=A-2(B-2C)-3C,
    N=A-2B+C.
    в случае, если знаки «!..» и «?..» считаются самостоятельными, а не
    как «!»+«…» и «?»+«…». В противном случае, для подсчета числа многоточий в тек-
    сте к C надо прибавить X:
    M=C+X=C+B-2C,
    M=B-C.

  • Проблему неоднозначности в определении "многоточий" и " точек" я решала следующим образом:
    Изначально в строке поиска я задала команду найти "." (без пробелов) , далее найти "..". И потом я отняла число найденных ".." от числа найденных ".", и получила число "чистых ." в тексте. Так же для проверки результата, в произведении Л.Н.Толстого я искала знаки вручную

  • Алгоритм разрешения неоднозначности в определении числа "точек" и "многоточий":
    1) Посчитать общее кол-во найденных точек.- x
    2) Посчитать общее кол-во найденных многоточий, состоящих из 2-х точек ("..").- y
    3) Посчитать общее кол-во найденных многоточий, состоящих из 3-х точек ("...").- z
    4) Тогда кол-во точек в тексте равно х-(2y+3z)

     

 

 

kmp