Интернет, компьютеры, софт и прочий Hi-Tech

Подписаться через RSS2Email.ru

Всего: 2604 комментария

23.01.2012 21:42:40 на странице "Mozilla Firefox"
Mozilla Suite Гость любезная:)
здрастеWellзагрузите мазилу или гугл хром
23.01.2012 08:54:39 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
>Бредогенераторы можно разделить на четыре группы:
Группа номер 5 - повторять банальности.

Точно, забыл! Well
5. Миксеры. Берут кусочки текстов (абзацы, предложения) из разных источников и перемешивают их. Получается более читабельно, чем цепи Маркова или машинные переводы.
 
Программы проверки уникальности считают, что у таких текстов уникальность 0%. Поэтому таких текстов на статейном рынке нет. Однако в вебмастеринге этот приём применяется очень часто и очень успешно.
 
Статьи таким способом создавать бессмысленно, так как несвязность темы сразу выкупается, но взять, например, из БД названия товаров, их описания, цены, отзывы о товарах и т.п., а затем миксануть их на страницах сайта в разных сочетаниях - обычное дело. Посетители и поисковики считают, что находится на сайте интернет-магазина и просматривают прайс-лист, а реально - на псевдомагазине, созданном для Сапы.
23.01.2012 04:36:43 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
>Бредогенераторы можно разделить на четыре группы:
Группа номер 5 - повторять банальности.
 

>Главный критерий статьи - интересность. Чтобы посетитель сказал "класс!" и возвращался на сайт регулярно.
 
А вы уверены что сможете отличить "класс" от бреда?
А если уверены что можете, то тогда скажите пойдет завтра фондовый рынок вверх или вниз? И я от вот не знаю.
Потому любая "аналитика" предсказывающая неважно что, главное побольше мудреных слов и графиков, сойдет.
Другой вариант - холивары.
Иными словами для бреда подойдет любая тематика, где нет единственно правильного мнения.
22.01.2012 05:35:49 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
И известны протоколы, по которым они это передают?
Тогда никуда и переходить не надо, достаточно генерить поток таких сообщений с разных IP адресов Well

Это называется накруткой пользовательских факторов (ПФ). Существуют даже специализированные сервисы, которые обещают накрутить их за деньги любому желающему.
 
Получается плохо. Еще задолго до введения ПФ в формулы ранжирования, поисковики разрабатывали способы распознавания скликивания, которое наносило ущерб их системам контекстной рекламы. И за многие годы в этом хорошо преуспели. Теперь накопленный опыт применяется в борьбе с накрутками ПФ.
21.01.2012 21:57:27 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox vanilinkin
А если они ссылаются друг на друга? Допустим некая группа поставила это своей задачей.
Ссылки на забаненных или просто непосещаемых (неинтересных) страницах бесполезны, как сказано выше. Никто из участников такой группы в рейтинге поисковиков не поднимется (или поднимется совсем ненадолго), пусть хоть миллион ссылок друг на друга поставят в миллионе бредовых статей.
 
Мне попадаются в изрядном количестве, в том смысле что по форме оно не бред, а по содержанию наукообразная бессмыслица.
Даже если форма более менее человеческая, то посетители "проголосуют ногами", прекратят заходить - и прощай, рейтинг, навсегда.
 
Главный критерий статьи - интересность. Чтобы посетитель сказал "класс!" и возвращался на сайт регулярно. И друзьям-знакомым ссылки давал. Более эффективного способа продвижения не существует, а любые ухищрения давно известны и наказуемы.
21.01.2012 19:07:00 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
И известны протоколы, по которым они это передают?
Тогда никуда и переходить не надо, достаточно генерить поток таких сообщений с разных IP адресов Well
21.01.2012 18:45:47 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
А как поисковики могут отследить переходы? Переход же осуществляет клиентский браузер.

Яндекс.Метрика, Гугл.Аналитикс, Яндекс.Бар, браузер Хром, сборки браузеров от Яндекса, Гугл.Адсенс, Яндекс.Директ, tns-counter...
21.01.2012 18:21:46 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
>В поисковых системах реально очень мало бредотекстов.
Мне попадаются в изрядном количестве, в том смысле что по форме оно не бред, а по содержанию наукообразная бессмыслица.
 
>Ну и опять же, посетителей не приманить ни бредом, ни машинными переводами, ни пропущенным через синонимайзер контентом. Посетителю подавай только внятный текст, удобочитаемый. Иначе не вернётся, ссылкой не поделится и рейтинг в поисковой выдаче не повысит.
 
А если они ссылаются друг на друга? Допустим некая группа поставила это своей задачей.
 
>Кстати, если много ссылок на сайт разместить, но по ним никто никогда переходить не будет, то такие ссылки тоже бесполезны.
 
А как поисковики могут отследить переходы? Переход же осуществляет клиентский браузер.
21.01.2012 13:26:47 на странице "Облачное онлайн-хранилище Ubuntu One. Часть 2"
Google Chrome Гость Минтпользователь
Very we! Уже.
21.01.2012 11:25:24 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
Бредогенераторы можно разделить на четыре группы:
  1. На основе цепей Маркова. Принципиально не способны дать ничего лучшего, чем Яндекс.Рефераты. Распознаются без проблем.
     
  2. Машинные переводы. Лучше, чем цепи Маркова, но распознаются также без проблем.
     
  3. Синонимайзеры. Качество выходных текстов сильно зависит от используемой базы синонимов. База точных синонимов не сильно портит тексты, но и не обеспечивает нужной уникальности. Большая база синонимов обеспечивает нужную уникальность, но делает тексты нечитаемыми. Эти последние тоже распознаются без проблем.
     
  4. Рандомизаторы. Теоретически способны генерировать полностью "человеческие" тексты, но требуют большого труда над составлением первоначального шаблона. Если требуется меньше ста текстов, вообще нет смысла заморачиваться созданием шаблона, - проще заказать ручной рерайт.
     
    Практически, - я никогда не видел удовлетворительных текстов больших чем на 1000 знаков, сгенерированных рандомизаторов. Дело в том, что с увеличением длины текста экспоненциально возрастает сложность создания хорошего шаблона. Естественно, что для больших текстов никто удовлетворительных шаблонов не создает. В итоге также получаются бредотексты, хотя и более осмысленные, чем в первых двух случаях.

У меня была также идея написать бредогенератор на трейдерскую тематику

Можете взять за основу мой рандомизатор Well
Для генерации маленьких комментариев по заранее заданным шаблонам вполне подойдет.
 
продвижение ресурса, как ни верти, зависит больше от посетителей, нежели от всех остальных факторов вместе взятых.

Совершенно согласен.
21.01.2012 09:34:14 на странице "Интернет-пиратство — охота на забытый контент"
SeaMonkey vanilinkin
Вообще мне приходила в голову мысль что бредогенератор это достаточно мощное "кибернетическое оружие", поскольку достатчно быстро можно зафлудить любую тематику бессмысленным мусором.
В поисковых системах реально очень мало бредотекстов. Толковые администраторы сразу выпиливают такие комментарии и никогда не размещают бредостатей. Даже синонимайзеры не используют (меняющие  всё что можно и что нельзя на синонимы ради повышения уникальности).
 
Ну и опять же, посетителей не приманить ни бредом, ни машинными переводами, ни пропущенным через синонимайзер контентом. Посетителю подавай только внятный текст, удобочитаемый. Иначе не вернётся, ссылкой не поделится и рейтинг в поисковой выдаче не повысит.
 
Кстати, если много ссылок на сайт разместить, но по ним никто никогда переходить не будет, то такие ссылки тоже бесполезны.
 
Так что продвижение ресурса, как ни верти, зависит больше от посетителей, нежели от всех остальных факторов вместе взятых.
21.01.2012 08:52:11 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
>По утверждению автора, точность и полнота нахождения бредотекстов с помощью продвинутых версий алгоритма превышает 99%.
 
... порожденных одним из вышеперечисленных методов генерации текста.
Что в свою очередь сводит практическую ценность работы к нулю, ибо добваить новый  или видоизменить метод бесконечным числом способов не составляет труда.
 
Вообще мне приходила в голову мысль что бредогенератор это достаточно мощное "кибернетическое оружие", поскольку достатчно быстро можно зафлудить любую тематику бессмысленным мусором. А у человека, не способного анализировать и фильтровать потоки информации, это будет порождать "взрыв мозга".
У меня была также идея написать бредогенератор на трейдерскую тематику со всякими там скользящими средними и боллинжерами, но, похоже, эта идея пришла в голову кому то раньше меня. По моим ощущениям таким бредогенератором создается раздел "Комментарии" сайта finam.ru Well
21.01.2012 08:25:16 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
Я не могу указать вам реализацию, которую можно скачать. Но обратите внимание на эту статью: http://ceur-ws.org/Vol-803/paper27.pdf ("Методы обнаружения массово порождаемых неестественных текстов на основе анализа разнообразия тематической структуры текстов").
 
По утверждению автора, точность и полнота нахождения бредотекстов с помощью продвинутых версий алгоритма превышает 99%.
21.01.2012 07:16:37 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
>Современные статистические методы анализ текстов позволяют с высокой степенью достоверности отличить машинно-сгенерированные тексты от написанных человеком. Единственный минус этих алгоритмов - ресурсоемкость
 
А пример практически реалтизованной системы привести можете? Сайта там или отдельной программы.
Скармливаем ему сначала бред сгенерированный комьютером, а потом какой генерю бред я типа филосовского трактата на тему ковыряния в носу и смотрим на результат.
21.01.2012 06:31:03 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
Современные статистические методы анализ текстов позволяют с высокой степенью достоверности отличить машинно-сгенерированные тексты от написанных человеком. Единственный минус этих алгоритмов - ресурсоемкость. Поэтому они применяются поисковиками не "на лету", а лишь выборочно. Поэтому сайты, набитые бредотекстом поначалу неплохо живут и даже поднимаются в поисковой выдаче, и только через некоторое время вылетают в бан.
 
К сожалению, эти алгоритмы не в состоянии отличить тексты написанные талантливым человеком от текстов, написанных графоманом. Для этого сейчас пытаются применить так называемые пользовательские факторы, но и с ними не все гладко. Дело в том, что хороший текст, написанный для узкого круга специалистов, с точки зрения пользовательских факторов может оказаться менее ценным, чем тупая мыльная история для малолеток.
21.01.2012 03:14:00 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
>Но для этого нужно, чтобы статьи были интересными, внятными, удобочитаемыми.
 
Так вот о том и речь что статьи должны быть в первую очередь востребованными.
 
Здесь же идет речь о краже МУСОРА. Потому считаю эту проблему надуманной, актуальной может быть только для пиндосов, потому что ничего иного они произвести уже не в состоянии.
21.01.2012 02:46:41 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox vanilinkin
статьи с заброшенных сайтов порой мало отличаются от сгенерированных бредогенераторами
Вот потому заброшенные сайты и задвинуты в самые дебри выдачи.
 
Различить их может только живой человек, причем с интеллектуальным уровнем
Не нужно недооценивать современный софт. Он нередко бывает умнее и грамотнее иных людей. (Взять хотя бы банальную проверку грамматики и удобочитаемости в MS Word.)
 
Самое важное для расркутки любого сайта - это количество уникальных посещений, а не уникального текста. Но для этого нужно, чтобы статьи были интересными, внятными, удобочитаемыми.
 
Если народ толпами валит, ссылки распространяет, рекомендует друзьям-знакомым, то вполне достаточно 70-80% уникальности текста каждой статьи.
 
Кроме того, в выдаче всегда будут выше те новые сайты, которые добавляются в кандидаты на отправку поисковых роботов не кем попало, а зарегистрированными пользователями.
 
То есть, нужно войти в учётную запись на Яндексе и добавить свой новый  сайт в проекте Я.Вебмастер. Индексация произойдёт гораздо быстрее.
 
А на Bing.com мой сайт вообще сразу на первое место взлетел (причём, по ключевому для меня запросу), как только я добавил ссылку, предварительно войдя в аккаунт на Live.com (Hotmail). Хотя до этого Bing.com анонимную отправку в упор не желал замечать.
21.01.2012 00:33:28 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
>Он же vesna.yandex.ru, генератор бреда. За статьи из него Яндекс забанит не просто быстро, а очень быстро. И навсегда, без малейшего шанса на реабилитацию. Google, кстати, тоже забанит.
 
Скажем так, бредогенераторов существует великое множество.
Этот лишь очевидный пример, приведенный со смайликом.
 
Честно говоря, статьи с заброшенных сайтов порой мало отличаются от сгенерированных бредогенераторами. Различить их может только живой человек, причем с интеллектуальным уровнем выше американца Well
Это в свою очередь возможно в Википедии, но не в поисковиках.
20.01.2012 23:48:10 на странице "Облачное онлайн-хранилище Ubuntu One. Часть 2"
Mozilla Firefox vanilinkin
Апплет уведомлений в Минте 11 отваливается и без ubuntuone.
Переходите на Linux Mint 12, там не отваливается ни с ubuntuone, ни без.
20.01.2012 23:38:26 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox vanilinkin
По поводу уникальных текстов: есть прекрасный сайт referats.yandex.ru
Он же vesna.yandex.ru, генератор бреда. За статьи из него Яндекс забанит не просто быстро, а очень быстро. И навсегда, без малейшего шанса на реабилитацию. Google, кстати, тоже забанит.
 
Лучше размещать неуникальный контент, чем продукцию бредогенераторов. Лучше обновлять сайт раз в полгода, чем пихать хоть что-то из vesna.yandex.ru. Потому что в поиске сайт сначала поднимется, а потом внезапно получит расстрел без суда и следствия. Бан неизбежен. В Яндекс и Google не простаки работают.
20.01.2012 22:56:29 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
По поводу уникальных текстов: есть прекрасный сайт referats.yandex.ru Well
Уникально, а главное бесплатно. А то что бред, так вы сами говорите, что поисковикам без разницы.
Тексты же, которые читают (добровольно или принудительно), в рассматриваемую в статье категорию вряд ли попадают.
 
20.01.2012 22:19:39 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
Если речь идет о десятках/сотнях/тысячах текстов в день по 2 т.з.б.п. каждый, то своя графомания никак не спасает Well
 
Кому интересна чужая графомания?
  1. Покупателям SEO-ссылок. Дело в том, что контекстные ссылки в уникальных текстах индексируются лучше. Значит нужно ежедневно размещать множество уникальных текстов.
     
  2. Создателям сателлитов. По 10 сатов в день по 10-20 страниц каждый, - придется бежать на биржу.
     
  3. Труженикам Сапы. Чтобы иметь сколько нибудь значительный доход от Сапы нужно иметь многостраничный сайт. Чем больше тысяч страниц в индексе, тем выше доход. Не самому же их все писать. Приходится покупать.

Все эти люди хорошо знают, что уникальные тексты в первую очередь съедаются поисковиками, а те не в состоянии отличить графоманию от реально полезной и/или интересной статьи. Зато графомания стоит дешевле хороших статей и потому востребована.
20.01.2012 22:04:37 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox Гость
Неужели чужая графомания может представлять для кого то ценность? Не верю. Нынче писателей существенно больше чем читателей.
20.01.2012 21:19:25 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
С первым критерием все ясно. А второй обеспечивается тем, что
  1. Популярные программы проверки уникальности не смотрят в кэш поисковиков. Если Гугл выдает по запросу ссылки, Адвего.Плагиатус идет по этим ссылкам, напарывается на 404-ю ошибку и успокаивается.
     
  2. Оптимизаторы ориентируются в основном на Яндекс, так как Гугл все равно сожрет весь предложенный ему копипаст, а Яша будет крутить носом. Но поскольку в индексе Яши этого контента нет, то для него эти тексты "уникальны".
     
  3. Некоторым оптимизаторам вообще плевать на уникальность. Она их интересует лишь постольку, поскольку за этим следят ссылочные биржи. Но в силу первых двух причин биржи не хотят не могут обеспечить доскональную проверку десятков тысяч текстов, которые через них проходят.

В общем, как-то так.
20.01.2012 21:18:21 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox dima
Спасибо за замечания, исправил ошибки.
 
Что касается содержания, то, поскольку часто тусуюсь на TextSale, могу кое-что сказать по теме. Довольно часто встречаются статьи, выложенные в продажу сравнительно недавно, но судя по тексту, написанные очень-очень давно. У таких текстов, как понимаю, два источника:
  1. Отсканированные тексты старых печатных книг.
  2. Тексты, опубликованные на каких-то сайтах, а затем снятые.

Оба пункта запрещены правилами биржи, но, тем не менее, активно используются "копирайтерами". Если попадается такой текст, можно смело жаловаться в администрацию и велика вероятность, что покупку отменят, деньги вернут.
 
Поэтому такие статьи стоят очень-очень дешево. Расчет строится на то, что придет покупатель SEO-шник и накупит тонны этого г-а для размещения через ссылочные биржи. Таких покупателей качество статей не интересует (не для своего же ресурса). Главные критерии: низкая цена и уникальность.
20.01.2012 20:30:34 на странице "Интернет-пиратство — охота на забытый контент"
Mozilla Firefox vanilinkin
построить такую систему его защиты, которую впредь не сможет сломать ни один хакер.

А вот об этом, пожалуйста, подробнее! Какую именно систему защиты можно построить на Народ.ру и Blogger.com?
 
У меня Linux, я не боюсь троянов, ворующих пароли, но всё равно очень интересно. Думаю, многим будет интересно, у кого есть страницы на упомянутых ресурсах.
 
Впрочем, вряд ли Вы ответите. Лучше сам кое-что расскажу.
 
Всё, что размещается на Blogger.com, очень быстро индексируется в Google и остаётся в кэше поисковика очень долгое время после удаления блога. Особенно если при создании блога разрешить включать его в каталог Blogger (эта опция стоит по умолчанию, если не ошибаюсь). И если хакер будет ждать много месяцев из-за каждой статейки, то состарится и помрёт. Овчинка выделки не стоит.
 
А чтобы контент индексировался практически мгновенно, нужно завести страницу на Google+ и там делиться ссылками на каждую статью в Blogger.com.
 
Касаемо Народ.ру, этот бесплатный хостинг подходит для маленьких личных страничек, но не для серьёзных проектов. Это понимает даже владелец, Яндекс, потому индексирует очень неохотно. А если индексирует, то задвигает на 100500-ю страницу выдачи. То же самое - и в Google. С Народа трудно что-то украсть хотя бы потому, что трудно узнать о самом существовании сайта.
Very we!
 
P.S. "Тотчас" - наречие, пишется слитно (см. хотя бы Викисловарь). "Копируют с них статьи", опечатка.
20.01.2012 18:42:42 на странице "Облачное онлайн-хранилище Ubuntu One. Часть 2"
Google Chrome Гость Минтпользователь
Апплет уведомлений в Минте 11 отваливается и без ubuntuone.
20.01.2012 09:00:02 на странице "Профессия программист"
Mozilla Firefox dima
Пожалуйста Well
20.01.2012 08:49:26 на странице "Профессия программист"
Google Chrome Гость
СпасибоVery we!
19.01.2012 21:07:38 на странице "Генерация .lib из DLL с помощью Visual Studio"
Mozilla Firefox dima
Гугл говорит, что в def-файл можно добавить алиасы проблемных функций. Например, так:
Text
LIBRARY "xyz.dll"
EXPORTS
MyProblemFunction
_MyProblemFunction@4 = MyProblemFunction

А файл lib генерировать уже с помощью этого def.
Не знаю, поможет ли Вам это, мне к алиасам прибегать не приходилось.

© 2007-2012, Дмитрий Скоробогатов.
Разрешается воспроизводить, распространять и/или изменять материалы сайта
в соответствии с условиями GNU Free Documentation License,
версии 1.2 или любой более поздней версии, опубликованной FSF,
если только иное не указано в самих материалах.