Пару лет назад у одного френда был пост на тему поиска страниц, на которых недобросовестные СМИ и редакторы сайтов используют фотографии (конечно же, не известив об этом их автора) для освещения каких-либо событий, а зачастую и для привлечения клиентов и получения прибыли.
Небольшим, но основным недостатком того проекта было то, что все это работало только в среде 1С. Согласитесь, не у многих на компьютере установлена 1С? :) Тогда я попытался сделать аналогичное standalone-приложение, но из-за нехватки времени оно было заброшено еще на ранней стадии тестирования. Недавно я решил возвратиться к этому проекту. С тех пор формат выдачи результатов поисковиками изменился и пришлось переписывать весь алгоритм. Результат предлагаю потестировать вам. Программа в первую очередь, конечно же, пригодится фотографам, а таких у меня во френдах довольно много.
Итак, версия 1.0
Общий вид окна программы:
Принцип работы программы тот же, что и у проекта в 1C — различными способами задаются ссылки на фотографии и осуществляется поиск в Яндексе и Гугле на наличие их (или похожих на них) на сторонних сайтах. Результаты попадают в итоговую таблицу, где их можно просмотреть и пометить по признаку украдено/нормальное.
Подробнее про интерфейс.
Эта группа кнопок отвечает за способы добавления ссылок в программу.
Ссылки на фотографии можно добавить несколькими способами:
— Извлечением ссылок на jpg-изображения на странице по ее URL.
— Из доступных всем альбомов на Яндекс-фотках (неободимо только имя пользователя на Яндексе).
— Из файла. Формат файла: «1 строка — 1 прямая ссылка на jpg-изображение». Этот способ пригодится тем, кто хранит фото на собственном сайте.
— Из буфера обмена. Формат тот же: «1 строка — 1 прямая ссылка на jpg-изображение».
В каких поисковиках искать.
Показать ссылки, которые уже в очереди на проверку. В появившемся окне можно удалить лишние ссылки или полностью очистить очередь.
Старт/остановка поиска.
Статистика, какое количество ссылок того или иного типа имеется в базе: Все, Непросмотренные, Просмотренные, Украденные. Эти же кнопки являются фильтрами — при нажатии в таблице будут показаны только типа выбранного типа.
Очистить все результаты. Если что-то пошло не так)
По контекстному меню результатов:
«Открыть в браузере». (аналогично двойному щелчку) Открывает текущую ссылку в браузере по умолчанию.
«Пометить как…». Отмесает текущую запись соответствующим маркером.
«Открыть страницу поиска этого фото в…». Открывает страницу, которую выдает тот или иной поисковик для текущего фото.
«Открыть оригинальное фото». Открывает в браузере ссылку на оригинал текущего фото, по которой велся поиск. Аналогичный результ будет при щелчке на превью фото в правом нижнем углу таблицы.
Несколько вопросов которые наверняка возникнут:
1. Я точно знаю, что мое фото есть на сайте XXX, но программа его не показывает.
Программа не ищет ничего сама. Она лишь суммирует то, что нашли Яндекс и Гугл. И если они не выдают в результатах сайт XXX, значит по каким-то причинам этот сайт ими не проиндексирован или не попадает в результаты поиска. Бывает и так, что при проверке результатов для фото нет вообще, а при следующей проверке они появляются, поэтому рекомендуется переодическая проверка одних и тех же ссылок, раз в месяц, например — очень часто появляются новые результаты.
Однако, если выбрав для фото пункт меню «Открыть страницу поиска фото в…» Вы в открывшейся странице все-таки найдете этот сайт XXX в результатах поиска, то сообщите мне об этом, с указанием ссылки на фото, которое искалось.
2. В результатах попадаются страницы, где нет моей фотографии.
Да, порой у поисковиков бывают ложные срабатывания. Второй вариант подобных случаев — на странице находится похожее на Ваше фото, снятое в том же месте с того же ракурса или похожее по геометрии, цвету и другим параметрам.
3. У меня выдает результат типа htttp://vk.com/idXXXXX, но там нет моего фото.
Страницы стен личных страниц и сообществ ВКонтакте являются динамическими, поэтому когда Вы открываете ссылку из программы, Вы видите актуальную на данный момент страницу, а не ту, что была на момент, когда ее проиндексировал поисковик.
Например, пользователь idXXXXX использовал Ваше фото у себя на стене 1 января 2015 года, поисковик ее проиндексировал и запомнил. Но с тех пор пользователь мог написать еще не одну сотню записей и когда вы открываете его стену через месяц/год, то конечно же тот пост уже будет далеко внизу страницы.
4. При импорте ссылок из альбома на Яндекс-фотках в очередь добавляются только 100 ссылок, а в альбоме фото гораздо больше.
К сожалению, Яндекс не позволяет получить данные более 100 фотографий в одном альбоме. В таком случае, для проверки всех фотографий в альбоме необходимо получить код всех фото на сайте Яндекс-фоток.
5. Когда снимается блокировка на поиск в Гугле?
Точного ответа нет. Обычно, у меня через сутки бана уже не было. Если используется динамический IP при подключении к интернету, иногда может помочь ручной разрыв интернет-соединения и повторное подключение.
6. Какой код с Яндекс-фоток необходимо вставлять в программу?
В программу нужно вставлять код из поля «Ссылка на фото» для того размера, который вы используете в блоге (у меня это оригинал):
При этом лишние строки «Фотографии в альбоме…» удалять не обязательно, они отсеятся автоматически.
Известные баги:
— После запуска проверки и изменении размеров окна после этого, может перестать работать навигация по таблице результатов. При этом поиск продолжает нормально работать. Поэтому после того, как запустите поиск, лучше свернуть программу в трей, она будет работать в фоне. Тем более, что поиск не такой уж и быстрый, особенно в Гугле, т.к. для того,чтобы избежать бана, введен таймаут перед проверкой каждого фото.
— Если при работающей проверке сделать фильтрацию, отличную от «Все», и при этом в поиске найдется результат, то фильтрация сбрасывается на «Все».
— На Windows XP может работать нестабильно, выдавая ошибку из-за dll-файлов. Работоспособность проверялась на Windows 7 и 8.1.
На данный момент это, можно сказать, бета-версия. Конечно же, есть глюки и многое еще будет доделываться. В том числе и по результатам ваших отзывов). Хотелось бы узнать — сколько ссылок проверялось, много ли нашлось результатов? Забанил ли Гугл?)
История обновлений:
v1.3 (06.12.2016)
— Исправления из-за изменения формата вывода результатов поисковиками
v1.2 (30.04.2016)
— Исправления из-за изменения формата вывода результатов поисковиками.
v1.1 (03.06.2015)
— Добавлен импорт ссылок на фото, извлеченных с интернет-страницы. Указываете URL, программа извлекает с нее ссылки на все jpg-изображения.
— Добавлена возможность составления «белого списка» сайтов, которые будут автоматически помечаться Просмотренными (зеленым цветом). Например, сюда можно добавить адрес своего ЖЖ — «pavelpanko.livejournal.com» (или часть адреса — «pavelpanko») и в дальнейшем не придется тратить время на ручную пометку найденных ссылок со своего ЖЖ.
Если вы обновляете уже имеющуюся версию программы:
Скачайте архив и распакуйте его в папку с программой, заменив все файлы.
Если хотите начать пользоваться программой впервые:
Скачать. Работает без установки.
Пингбэк: MyStolenPhotos 1.1 | Фотограф Павел Панько
При импорте ссылок из альбома на Яндекс-фотках в очередь добавляются только 100 ссылок, а в альбоме фото гораздо больше.
К сожалению, это ограничение самих Я-фоток. Для альбомов, где больше 100 фото рациональнее получить код всех фото альбома на самом сайте и вставить в программу
Коллега, Тёзка, спасибо! Сейчас потестирую от души…
Давно о такой проге мечтал.