Сделал табличку с группами и основными данными о них.
Сейчас в базе чуть меньше миллиона групп.
Полный дамп mysql >1.000.000 групп
Поиск ищет по названию и описанию.
Так же есть 3 ключа для спец поиска. is_open — только открытые группы can_post — только открытые стены can_comment — можно комментировать записи на стене группы
Например вводим в поиск: is_open can_post avito
Получаем: список авито-групп открытые группы с открытыми стенами
Второй пример: can_post iphone
Получаем: список iphone-групп с открытыми стенами
Данные можно скачать: справа сверху бургер иконка(три полоски).
1. Выгрузить весь список групп.
2. Выгрузить видимые данные — только то что видно на странице. Максимум 800 в пагинации.
И так почему же важно указывать правильный тип столбца в структуре таблицы
Наглядный пример почему не надо делать столбцы (varchar), особенно если этот столбец задуман как (int)eger
Недавно исследовал интересный сервис по сбору VK профилей:
Вход в сервис стоит 5000 рублей единоразово и 5 рублей за каждый собранный профиль человека.
Цель была узнать как и что работает при определении профиля человека, но речь пойдет не об этом. При тщательном ковырянии в работе скриптов нашел интересный кусок, который к определению имеет отношение примерно никакое 🙂
Стал плохо жить и переехал на собственный выделенный сервер.
Но вот незадача он кушал ресурсы сервера так как-будто это был дешевый шаред хостинг, и сервер не выдерживал нагрузки в пиковые моменты.
А на сайт тот заходили по 10-20 тысяч человек в день и это было очень печально, ведь там стояли еще несколько почти таких же сайтов. Стали мы искать кто же так кушает наш сервер и почему все так плохо.
И нашли мы волшебную строчку в functions.php темы.
Какой-то добрый программист оставил там всего лишь одну строчку которая перед каждой новостью с помощью preg_replace добавляла блок адсенса в нужное место.
Всего лишь один preg_replace для всего контента перед выводом ставил дедик на колени и заставлял его молиться чтобы пронать gateway.
Надеюсь эта маленькая история научит вас любить и уважать функции и не использовать регулярки везде где только можно.
Если поле в базе имеет тип время/дата, в моем случае timestamp, то php-ar отдает отформатированную по дефолту строку, вместо собственно самого timestampа.
При курении доков выяснилось что используется там обычный DateTime из php
В общем чтобы получить unix время из поля приходится делать как-то так
PHP
1
2
$cpayment=Cpayment::find('first');
echo$cpayment->time->getTimestamp();
Памятка для себя, потому что второй раз затупил c этим косяком 🙂
Зачем нужен можно глянуть здесь:
Забрать можно здесь:
Собственно запускать через консоль: php index.php
В domains.txt будут записаны домены с рейтингом 1 и 2(зеленые кружки и чуть менее зеленые кружки)
Остается дело за малым, проверить наличие обратных ссылок с этих сайтов. Я не придумал простого автоматического способа без обхода капч поисковиков, так что думайте сами.
Прикладываю результат для 200-999 страниц 14к «трастовых» доменов: