Блог очередного разработчика

Sanasol

Конкурентность поисковых запросов на YouTube

Небольшая страничка для определения количества выдачи по запросам в YouTube.
Смотреть здесь: http://sanasol-test.ru/yt/

При запросах на YouTube срабатывает автокоррекция запроса, если он набран например в транслите. Будьте внимательны.
Конкурентность ключей в YouTube

Запросы кешируются на 12 часов, дабы не поймать блок и вообще не спамить.

Поиск VK групп для спама

Сделал табличку с группами и основными данными о них.
Сейчас в базе чуть меньше миллиона групп.

Полный дамп mysql >1.000.000 групп

https://mega.nz/#!Hwhn0RYR!xAXFJIXH4ifFlEkAUiSAjzi0lWQJKtzzGZL_ucF-fcM

Поиск ищет по названию и описанию.

Так же есть 3 ключа для спец поиска.
is_open — только открытые группы
can_post — только открытые стены
can_comment — можно комментировать записи на стене группы

Например вводим в поиск: is_open can_post avito
Получаем: список авито-групп открытые группы с открытыми стенами

Второй пример: can_post iphone
Получаем: список iphone-групп с открытыми стенами

Данные можно скачать: справа сверху бургер иконка(три полоски).
1. Выгрузить весь список групп.
2. Выгрузить видимые данные — только то что видно на странице. Максимум 800 в пагинации.

Время от времени база будет обновляться.

История о том как одним запросом весь сервер занять

И так почему же важно указывать правильный тип столбца в структуре таблицы
Наглядный пример почему не надо делать столбцы (varchar), особенно если этот столбец задуман как (int)eger

describe с колонкой varchar
describe с колонкой varchar

describe с колонкой integer
describe с колонкой integer

мунин до и после исправления
Изменение типа столбца в одной таблице

Бородач Сервис

Пару недель назад открыл сервис для работы с VK

Адрес: vboro.de

Список функций на данный момент:

  • Сбор ВК профилей посетителей ваших сайтов
  • Подписка на паблик/группу/страницу посетителей ваших сайтов
  • Мониторинг ваших ВК групп/пабликов
  • Парсинг постов из чужих групп + Отложенный постинг этих постов
  • Партнерская программа (доступна только по договоренности)

После регистрации по рефке работает триал на сутки.

Отзывы и статистика внутри
(далее…)

Рыболовы и реклама


fisherman-31599_640

Доброго времени суток.

Недавно исследовал интересный сервис по сбору VK профилей: http://socfishing.ru/

Вход в сервис стоит 5000 рублей единоразово и 5 рублей за каждый собранный профиль человека.

Цель была узнать как и что работает при определении профиля человека, но речь пойдет не об этом. При тщательном ковырянии в работе скриптов нашел интересный кусок, который к определению имеет отношение примерно никакое 🙂

А нашелся собственно вот такой вот код

Для тех кто не шарит: код вставляет на страницу 1 пиксельный прозрачный фрейм с таким содержанием(зашифрованным в base64)

Т.е. идет переадресация фрейма на адрес https://you43.ru/yandintsite/?u=fbb89e36c3592f22216ce333d8d1a250

И самое интересное находится по этому адресу

(далее…)

История про регулярное выражение

Жил был один новостной сайт на вордпрессе.

Стал плохо жить и переехал к нам на хостинг на собственный выделенный сервер.

Но вот незадача он кушал ресурсы сервера так как-будто это был дешевый шаред хостинг, и сервер не выдерживал нагрузки в пиковые моменты.

А на сайт тот заходили по 10-20 тысяч человек в день и это было очень печально, ведь там стояли еще несколько почти таких же сайтов. Стали мы искать кто же так кушает наш сервер и почему все так плохо.

И нашли мы волшебную строчку в functions.php темы.

Какой-то добрый программист оставил там всего лишь одну строчку которая перед каждой новостью с помощью preg_replace добавляла блок адсенса в нужное место.

Всего лишь один preg_replace для всего контента перед выводом ставил дедик на колени и заставлял его молиться чтобы пронать gateway.

Надеюсь эта маленькая история научит вас любить и уважать функции и не использовать регулярки везде где только можно.

Конец.

Получение timestamp из timestamp O_O

При использовании php-activerecord наткнулся на «косяк».

Если поле в базе имеет тип время/дата, в моем случае timestamp, то php-ar отдает отформатированную по дефолту строку, вместо собственно самого timestampа.

При курении доков выяснилось что используется там обычный DateTime из php

В общем чтобы получить unix время из поля приходится делать как-то так

Памятка для себя, потому что второй раз затупил c этим косяком 🙂

WOT парсер «трастовых» доменов

Зачем нужен можно глянуть здесь: http://sarkazm.name/odnoklassniki/obhod-prokladki-v-odnoklassnikah/
Забрать можно здесь: https://github.com/S-anasol/sanasol/tree/master/web/wotparse
Собственно запускать через консоль: php index.php
В domains.txt будут записаны домены с рейтингом 1 и 2(зеленые кружки и чуть менее зеленые кружки)

Остается дело за малым, проверить наличие обратных ссылок с этих сайтов. Я не придумал простого автоматического способа без обхода капч поисковиков, так что думайте сами.
Прикладываю результат для 200-999 страниц 14к «трастовых» доменов: https://gist.github.com/S-anasol/888b370bf6234cce0134