Короче скачать программу вот здесь! ничего для нее не надо, работает сразу, инструкция внутри. Но там ниже еще есть.
Короче еще одна получше побыстрее (раз в 10) почувствительней здесь! Но дизайн кошмарный, работает сразу, инструкция там-же. Алгоритм немного другой. Вывод графический. Сравнивает произведения одного автора со всеми произведениями другого. Ну и вылизал ее получше.

как богатые грабят бедных
Если вас просят прислать кусочек произведения на пробу, то будьте готовы к тому, что его может использовать в качестве строительного материала именитый и многопечатающийся мэтр. Это встречается гораздо чаще, чем вы можете себе представить. Я не прошу мне верить, а прошу убедиться в этом самим. Как, - читайте дальше.

Для авторов молодых и глупых

Короче, без вступлений обойдемся. Не хочу жаловаться на судьбу и рассказывать истории про бандитов плагиаторов. Предлагаю половить их самим. Это лучше, чем судиться. Во всяком случае проще. Боюсь, вы даже не подозреваете насколько популярно это замечательное явление. Подозреваю, что на поток уже поставлено. И самое, пожалуй, интересное, что используют они в основном неопубликованые произведения. Где берут? Да открывают издательский сайт с призывом молодым авторам послать 2-3 главы на пробу. Ну и съедают эту пробу. Впрочем, возможно и сами издательства прикармливают старых, верных им авторов свежатинкой, что им присылают идиоты вроде меня с вами. Впрочем, бывает плагиат и творческий: воруют идею, сюжеты, стиль. Я спокойно отлавливаю их всех (а много их...) Тут в чем дело. Найти автора, у которого они утащили, трудно, - надо всех перебрать. А его не публикуют (надо ли объяснять почему?). Но узнать, что это глава сворована, проблем никаких. Вот программа (розовая такая, уж не поленитесь пролистните страничку, это вроде не очень трудно) писана на питоне, чтоб не подозревали на вируса. Скопируйте прямо с листа и вставьте в файл, назовите красивым, заслуживающим внимания простым советским именем и дайте расширение .py Ну а пока она там копируется, почитайте обращения

Желающим заработать

Думаю, что в данном случае самый жуткий шантаж будет верхом благородного служения обществу. Будут нужны еще программы, пишите. Денег не высылайте. Если в результате вашей деятельности удавится хоть один плагиатор, я деньги вам сам вышлю.

Тем, кто красиво работает со стилем и любит его менять

не волнуйтесь Если в произведении ведется рассказ от друго лица, то метод 3 может дать ненадежный результат. Но 1 и 2 покажет, что это ваш текст. Врать не буду, ошибки возможны. Но случайно и один раз, и в коротких текстах и при плохом переводе разными авторами. Впрочем, у меня есть еще и программы, и методы, и идеи. И главное, из содержания бывает ясно, когда оправдано меняется стиль. Эти куски можно и убрать. запомните, стиль - это человек, а его подделать нельзя.

Для плагиаторов

Попробуйте подправить ворованные главы, ориентируясь на список ключевых слов. Когда закончите, отредактируйте список и начинайте заново. И так по всему словарю великого русского языка, ну а потом меняйте параметр
huha и по новой. Метод 2 обойдете, выкинув чужие главы. Метод 1 не обойдете никогда... Ну и потом, есть еще программки... да и книжки ваши, кстати, уже изданы...

Для издательств, которые пользуются этим, но им это не нравится

Готов к сотрудничеству

Для издательств, которые пользуются этим, но им это по ...

скоро вам будет не по ...

Для издательств, которые пользуются этим и делают на этом бизнес ...

пощады не ждите!

Для литературных негров

Ну что, смертники, покувыркаемся?

Для программистов

да, конечно, понимаю не била-гейтса половину строк можно выкинуть, но это я за день свалял, но ведь достали гады... Если утащите текст программы для своих нужд или там коммерческого использования, только спасибо скажу...

ВСЕМ! ВСЕМ! ВСЕМ!

Распространите хотя бы текст программы, сами понимаете какой вопеж начнется...

Инструкция

добудьте python. Это язык такой, он везде есть. Я лично брал с инета. скопируйте прогу в его директорию, запустить так
python 1.py > fileout.txt а потом смотреть этот самый fileout.txt при условии что 1.py это имя нашей программы
источники
Павлов-"pavlo002.txt","pavlo001.txt"
Панченко-"panch001.txt","panch002.txt" (эти авторы у меня в библиотеке рядом стояли)
первая строчка
namefile=["pavlo002.txt","pavlo001.txt","panch001.txt","panch002.txt"]
имена файлов они в досовской кодировке (переведите или откорректируйте txthtm) для начала поучитесь на гарантированных текстах 2 одного автора, 2 - другого. Потом найдите подозрительного, разбейте на главы и каждую главу в отдельный файл. И пропустите через программу, чужие главы сразу выпадут. Когда освоите эту программу, будете очень и очень приятно удивлены. Используется 3 метода, 2 моих, один - Фоменко. А вообще-то идей у меня их штук на 50. Итак, произведения попарно сравниваются друг с другом, информация выводится по разделам
======================================================================
(1.0050723489638822, ' 3.66296 ', '96.59619 ', 'pavlo001.txt', 'pavlo002.txt')
(1.0856247625853557, ' 2.83600 ', '77.54879 ', 'panch002.txt', 'panch001.txt')
(1.1191636538489886, ' 4.80437 ', '140.85325 ', 'panch001.txt', 'pavlo001.txt')
(1.1248404424490042, ' 5.94914 ', '254.64556 ', 'panch001.txt', 'pavlo002.txt')
(1.2149917760039672, ' 5.59035 ', '204.67584 ', 'panch002.txt', 'pavlo001.txt')
(1.2211546382801064, ' 6.39494 ', '370.85588 ', 'panch002.txt', 'pavlo002.txt')
======================================================================
этот раздел объяснять не буду, так и так не поймете и сам, положим, не очень понимаю но в начале самые близкие сочетания файлов
======================================================================
(0.15865187522516366, 'pavlo002.txt')
(0.15945661290007998, 'pavlo001.txt')
(0.17845804552363728, 'panch001.txt')
(0.19373847330304531, 'panch002.txt')
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
это алгоритм Фоменко (спасибо ему, кстати). Частота служебных слов, как видите, у Павлова их меньше чем у Панченко, но Павлов вроде четче пишет, меньше накручивается от других
shablon -список служебных слов

даже pavlo002.txt 119.259102824
даже pavlo001.txt 184.314719822
даже panch001.txt 617.628383969
даже panch002.txt 1032.34222482
уже pavlo002.txt 136.651055319
уже pavlo001.txt 219.422285503
уже panch001.txt 769.630385008
уже panch002.txt 1171.78714408
тоже pavlo002.txt 57.1449867697
тоже pavlo001.txt 119.950849408
тоже panch001.txt 402.131876166
тоже panch002.txt 647.744141064
же pavlo002.txt 119.259102824
же pavlo001.txt 247.703380078
же panch001.txt 906.239778346
же panch002.txt 1448.42787099
лишь pavlo002.txt 29.8147757059
лишь pavlo001.txt 63.3886602563
лишь panch001.txt 236.66134339
лишь panch002.txt 418.334757771
**********************************************************************
rpw
rpw={"all":0,"allsl":0,"в":0,"на":0,"с":0,"за":0,"к":0,"по":0,"из":0,"у":0,"от":0,"для":0,"во":0,"без":0,"до":0,"о":0,"через":0,"со":0,"при":0,"про":0,"об":0,"ко":0,"над":0,"из-за":0,"из-под":0,"под":0,"и":0,"что":0,"но":0,"а":0,"да":0,"хотя":0,"когда":0,"чтобы":0,"если":0,"тоже":0,"или":0,"то есть":0,"зато":0,"будто":0,"не":0,"как":0,"же":0,"даже":0,"бы":0,"ли":0,"только":0,"вот":0,"то":0,"ни":0,"лишь":0,"ведь":0,"вон":0,"то-есть":0,"нибудь":0,"уже":0,"либо":0}
это список ключевых слов для анализа я использовал служебные, но это не обязательно главное, чтоб они были и в списке
shablon
shablon={"all":0,"allsl":0,"в":0,"на":0,"с":0,"за":0,"к":0,"по":0,"из":0,"у":0,"от":0,"для":0,"во":0,"без":0,"до":0,"о":0,"через":0,"со":0,"при":0,"про":0,"об":0,"ко":0,"над":0,"из-за":0,"из-под":0,"под":0,"и":0,"что":0,"но":0,"а":0,"да":0,"хотя":0,"когда":0,"чтобы":0,"если":0,"тоже":0,"или":0,"то есть":0,"зато":0,"будто":0,"не":0,"как":0,"же":0,"даже":0,"бы":0,"ли":0,"только":0,"вот":0,"то":0,"ни":0,"лишь":0,"ведь":0,"вон":0,"то-есть":0,"нибудь":0,"уже":0,"либо":0}
длина списка
huha=5
(8.170704183853438, 'panch002.txt', 'panch001.txt')
(9.4533728201419009, 'pavlo001.txt', 'pavlo002.txt')
(17.6030121648168, 'panch001.txt', 'pavlo001.txt')
(28.788333083208059, 'panch002.txt', 'pavlo001.txt')
(33.384644107547786, 'panch001.txt', 'pavlo002.txt')
(54.742769569767468, 'panch002.txt', 'pavlo002.txt')
rpw анализ по ключевым словам, файлы сравниваются попарно чем меньше коэффициент (1 параметр), тем ближе тексты как видите, результаты отличны от метода 1, но Павлова с Павловым и Панченко с Панченко неплохо коррелируют, а вот друг с другом....



namefile=["pavlo002.txt","pavlo001.txt","panch001.txt","panch002.txt"] huha=5 ps1="%8.5f " import math du=0 def vix(hkw,hig): hig1=hig+du hkw1=hkw+du if hkw>hig:return(hkw1/hig1) else:return(hig1/hkw1) def vil(vs): txthtm=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 126, 33, 126, 35, 36, 37, 38, 39, 126, 126, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 197, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 126, 92, 126, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 224, 225, 226, 227, 228, 229, 230, 231, 232, 201, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 218, 251, 252, 253, 254, 255, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 234, 251, 252, 253, 254, 255, 184, 184, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 0, 0, 0, 0] rs="" if len(vs)<3:return(rs) zapr='"' znak='".,-!?:;)(1234567890' words=[] word="" i=0 for k in range(len(vs)): if vs[k]==" " or vs[k]=="\n": if len(word)==1: words.append(word) word="" if len(word)>1 and word[-1]==" ":word=word[:-1] if len(word)>1: for m in range(len(znak)): if len(word)>1 and word[-1]==znak[m]: word=word[:-1] words.append(znak[m]) words.append(word) word="" else : u1=vs[k] u2=ord(u1) u3=txthtm[u2] u4=chr(u3) if u4!="~":word=word+u4 return(words) gugu={} shablon={"all":0,"allsl":0,"в":0,"на":0,"с":0,"за":0,"к":0,"по":0,"из":0,"у":0,"от":0,"для":0,"во":0,"без":0,"до":0,"о":0,"через":0,"со":0,"при":0,"про":0,"об":0,"ко":0,"над":0,"из-за":0,"из-под":0,"под":0,"и":0,"что":0,"но":0,"а":0,"да":0,"хотя":0,"когда":0,"чтобы":0,"если":0,"тоже":0,"или":0,"то есть":0,"зато":0,"будто":0,"не":0,"как":0,"же":0,"даже":0,"бы":0,"ли":0,"только":0,"вот":0,"то":0,"ни":0,"лишь":0,"ведь":0,"вон":0,"то-есть":0,"нибудь":0,"уже":0,"либо":0} keymw=shablon.keys() rpw={"all":0,"allsl":0,"в":0,"на":0,"с":0,"за":0,"к":0,"по":0,"из":0,"у":0,"от":0,"для":0,"во":0,"без":0,"до":0,"о":0,"через":0,"со":0,"при":0,"про":0,"об":0,"ко":0,"над":0,"из-за":0,"из-под":0,"под":0,"и":0,"что":0,"но":0,"а":0,"да":0,"хотя":0,"когда":0,"чтобы":0,"если":0,"тоже":0,"или":0,"то есть":0,"зато":0,"будто":0,"не":0,"как":0,"же":0,"даже":0,"бы":0,"ли":0,"только":0,"вот":0,"то":0,"ни":0,"лишь":0,"ведь":0,"вон":0,"то-есть":0,"нибудь":0,"уже":0,"либо":0} for m in range(len(namefile)): ss=[] fr = open (namefile[m],'r') ss=fr.readlines () mwords=shablon gugu[namefile[m]]={} fr.close() p=0 pp=0 for i in range(len(ss)-1): mw=vil(ss[i]) for k in range(len(mw)): p=p+1 mwk=mw[k] if mwords.has_key(mwk)>0 : mwords[mwk]=mwords[mwk]+1 pp=pp+1 mwords["all"]=p mwords["allsl"]=pp for j in range(len(keymw)): uk=float(mwords["all"]) uu=float(mwords[keymw[j]]) if uk>0 and uu>0:ue=uu/uk else: ue=0 gugu[namefile[m]][keymw[j]]=ue hula=[] for i in range(len(namefile)): for k in range (i+1,len(namefile)): gnfk=namefile[k] gnfi=namefile[i] wert=gugu[gnfk] gori=gugu[gnfi] sk=0 hhr=0 for j in range(len(keymw)): if keymw[j]!="all" or keymw[j]!="allsl": hkw=wert[keymw[j]] hig=gori[keymw[j]] if hkw>0 and hig>0: hr=hkw/hig hig=(gori[keymw[j]]/wert[keymw[j]]) else: hr=0 hig=0 hkw=1 if hkw>0 and hig>0:rpw[keymw[j]]=rpw[keymw[j]]+vix(hkw,hig) r=hkw-hig rr=r*r sk=sk+rr hhr=hhr+hr sqsk=math.sqrt(sk) if wert["allsl"]>0 and gori["allsl"]>0:fifa=wert["allsl"]/gori["allsl"] else:fifa=0 hula.append((fifa,str(ps1 % sqsk),str(ps1 % hhr),gnfk,gnfi)) print ("="*70) hula.sort() for l in range(len(hula)): print hula[l] fifka=[] for m in range(len(namefile)): fir=gugu[namefile[m]]["allsl"] fifka.append((fir,namefile[m])) fifka.sort() print ("="*70) for u in range(len(fifka)): print fifka[u] print ("~"*70) krpw=rpw.keys() duka=[] for h in range(len(krpw)): gnfk=krpw[h] duka.append((rpw[krpw[h]],krpw[h])) keymw2=[] guska={} duka.sort() dukai=duka[-huha:] for n in range(len(dukai)): (a,c)=dukai[n] keymw2.append(c) for m in range(len(namefile)): gnfk=namefile[m] wert=gugu[gnfk] fir=wert[c] print c,namefile[m],fir*100000 hula2=[] for i in range(len(namefile)): for k in range (i+1,len(namefile)): gnfk=namefile[k] gnfi=namefile[i] wert=gugu[gnfk] gori=gugu[gnfi] sk=0 hhr=0 for j in range(len(keymw2)): hkw=wert[keymw2[j]] hig=gori[keymw2[j]] if hkw>0 and hig>0:hr=vix(hkw,hig) else:hr=0 hhr=hhr+hr hula2.append((hhr,gnfk,gnfi)) print ("*"*70) hula2.sort() for l in range(len(hula2)): print hula2[l]



автор Акаемов Андрей
дата создания: 24.02.2006

Хостинг от uCoz