phpQuery - незаменимая вещь!
Понравился мне сабж. Очень удобно с его помощью писать парсеры. До него пробовал разные методы:
- сам через DOM парсил страницу, нужные тэги
- через регулярки меня вообще не проперло
- SimpleHTMLDom - впринципе тоже удобно, но там какой то баг был или руки у меня кривые
В итоге остановился на phpQuery.
Все сабж хвалят за простоту, за то, что все также просто, как в jQuery. Я последнего нихрена не знаю. Никак не могу добраться до этой темы, но уже небольшие представления имею.
Чем меня не проперли регулярки?
А тем, что я не только тупо парсю контент, так я еще меняю на "лету" различные тэги и атрибуты. Через регулярки тоже можно, но через phpQuery все просто и очевидно.
Парсер на лету скачивает изображения, ресайзит их, для тегов img правит атрибуты: src, alt, class. Так же может img обернуть в div с нужным классом. Так же для внешних ссылок (задается условие) изменяет href на нужное значение. Для видео-тэга (<object...) может менять размер видео.
Для парсинга у меня уже есть заготовка-плагин для Maxsite CMS.
Соответственно, все полученное добро льется в базу этой CMS и сайт работает на ней.
CMS-ка очень шустрая, гибкая.
Ну а для парсинга различных источников я просто модифицирую плагин. Делается это достаточно быстро, если информацию оставлять "как есть". Если надо как-то немного по-другому - то, на это надо время.
Так что, если кто-то случайно попал на эту страницу и кому-то нужен парсер (случайное совпадение), то я могу Вам его за "мани" сделать. Кому интересно, писать сюда: dimonich110 {собачий лай} гугльмаил тчк КОМ. Да, кстати, дешевле, чем за 1000р, делаь не буду. :D

Оставьте комментарий!