Home > Шаблоны > VK Docs Grabber — уникальный контент 0,5 млн зн. за полчаса

VK Docs Grabber — уникальный контент 0,5 млн зн. за полчаса

March 15th, 2015

Предлагается комплекс софта и методика для постоянного сбора уникального контента. Если вы думаете что там нечего ловить, то это не так. 0.5-1% уника там есть, и методика позволяет его отсеять. Парсим документы, причем в промышленных объемах.

Состав сборки:
 — мой шаблон под Zenno Poster
 — методика по обработке больших объемов текста через EtxtAntiplagiat (для новичков)
 — очень удобная программа для удаления дублей (free)
 — очень удобная программа-конвертер всех форматов документов (free)

Как это работает:
 — на входе файл с ключами, по которым будем парсить, на выходе папки по имени ключа, внутри все файлы разложены по папкам форматов файла.
 — в данный момент грабит doc, docx, rtf, txt + могу добавить форматы по вашему желанию.
 — ключи по мере парсинга из базы удаляются, так что если вдруг шаб вылетит по какой то причине — его можно снова запускать и он будет парсить с того же места.
 — чистим все на дубли, затем конвертируем и получаем txt файлы, которые уже можно прогнать через программу EtxtAntiplagiat и получить чистый уник.

Результаты эксперимента:
Была взята небольшая база ключей (ок.100шт), по которой за 10 часов на 10Mbit'ном канале в 1 поток было скачано ок. 5 Gb документов, все файлы скомпонованы по типам, после чего за день все было переконвертировано в txt.

hGioKtU
rKi9AjQ

Получилось ок 8 000 файлов, которые были прогнаны антиплагиатом экспресс-проверкой, на что ушел второй день. Затем все получившиеся файлы были прогнаны второй раз через EtxtAntiplagiat, с уже более строгими настройками. В результате получилось почти 100 Мб (1500 файлов) уникального текста в txt формате и стоило это ок $2,5 за антигейт. Далее весь этот массив подлежал ручной проверке. В основном это оказались уникальные дипломы, лекции, конспекты, курсовые, книги и просто статьи. Буквально за 30 минут я насобирал тематичных статей из чистого уникального текста без цифр и прочего мусора на 500 тыс знаков (на 1500р при средней цене за скан в 3р/1k). Причем это зависит от ключей, которые вы используете. Я предполагаю что можно найти такие ключи, по которым процент уника будет больше.

o0vBUQx
rf9gF46

UPDATE по мотивам поступивших вопросов:
 — текста по коммерческим тематикам практически нет.
 — архив с образцами уника, показывающим в целом вид и качество получаемого продукта отправлю всем желающим, стучите в аську.
 — методика не для новичков. В инструкции все максимально разжевано, но тем не менее — желательно чтобы у вас были навыки освоения новых программ, положительный баланс на сервисе antigate.ru и много терпения.
 — инструкцию надо читать внимательно, в частности рекомендуемые настройки т.к. в основном все проблемы возникают от невнимательности.

Смысл методики:
Из кучи шлака, который мы напарсим шаблоном (5-10 гб) извлечь путем многоступенчатой проверки уникальный контент. Это требует определенных затрат времени (2-3 дня на чекинг) и труда — проверить уже отсеяный 2-3-х ступенчатой проверкой контент вручную. И что нам попадётся — заранее предсказать практически невозможно. Можно проделать эту работу самому или поручить работнику.

Для чего подойдет такой контент:
Идеально для блогов, которые торгуют в Блогуне/Ротапосте и где постоянно требуется уникальный контент для постов, куда ставятся постовые. Туда, как правило, тематика текста вообще не важна, главное чтобы он был уникальным. Подойдёт ли для сателлитов? Честно скажу — не уверен, т.к. с трудом представляю какой туда контент нужен. Если у вас есть опыт адаптации под сателлиты конспектов, лекций или курсовых (я имею в виду гуманитарные дисциплины) — то, значит, вы сумеете его применить. Сам я сателлитами не занимался и такой контент использую только для ссылочных бирж.

Условия продажи:

В виде шаблона для ZennoPoster — $10
Как самостоятельный софт (ZennoBox) — $20.
Categories: Шаблоны Tags: ,
  1. Артем
    December 15th, 2013 at 18:31 | #1

    хотелось бы узнать, до сих пор все работает ? реально ли найти уник контент сейчас, ведь многие уже знают о таком способе

  2. roland
    December 17th, 2013 at 05:47 | #2

    @Артем

    Думаю что работает конечно — постоянно пояляется новый уник, а добывает его мало кто, т.к. это связано с определенными трудозатратами. Большинство предпочитает просто покупать готовый и не заморачиваться.

  3. Константин
    March 27th, 2014 at 16:48 | #3

    Автор, есть возможность заказать сбор файлов определенного типа по определенным ключевым словам? Сама программа не нужна.

  4. roland
    March 27th, 2014 at 18:16 | #4

    @Константин

    пишите в аську что за ключи, сколько контента надо, какой бюджет

  5. Константин
    March 28th, 2014 at 08:33 | #5

    @roland

    Написал.

  6. Антон
    June 20th, 2014 at 20:10 | #6

    Приветствую. Готов купить шаблон.

  7. roland
    June 20th, 2014 at 20:21 | #7

    @Антон

    Стучите по контактам в сайдбаре

  8. Антон
    June 20th, 2014 at 20:40 | #8

    @roland

    Отправил на почту

  9. Angariya
    November 3rd, 2016 at 12:52 | #9

    Шаблон работает в старом интерфейсе VK, сейчас он изменился...

    • admin
      November 4th, 2016 at 04:21 | #10

      Последняя актуальная версия работает в новом дизайне.

Comments are closed.