HTML Parser для Qt

 — это, конечно, хорошо, но очень часто требуется разбирать документы , которые могут и не быть валидными.

В есть множество классов для работы с XML, но они не подходят для HTML, так как ошибки в HTML для них фатальны.

Ниже приведён вариант парсера для HTML, основанный на библиотеке libxml2. Далее »

Автор: , опубликовано в: Qt, комментариев: 3
7
Сен
2011

Пример рабочей реализации QDomDocument::elementById

Так сложилось, что в реализация метода QDomDocument::elementById() нерабочая: при попытке использования данного метода выдаётся предупреждение elementById() is not implemented and will always return a null node и возвращается пустой элемент .

Временами это очень неудобно: например, вместо использования из QXmlPatterns может быть проще получить элемент DOM по его id и пройтись по его потомкам. А при использовании XPath функцию id() использовать не получится в силу тех же причин. Далее »

Автор: , опубликовано в: Qt, комментариев: 4
19
Мар
2011

Генерация карты сайта в HTML из XML: часть 2

Продолжение статьи «Генерация карты сайта в HTML из XML».

В этой части мы рассмотрим, как сделать так, чтобы на одной генерируемой странице располагалось не более определённого количества ссылок. Далее »

Автор: , опубликовано в: Linux, SEO, комментариев: 4
8
Ноя
2010

Генерация карты сайта в HTML из XML

Проблема: есть достаточно большой сайт, у которого есть карта в формате XML. Есть бот, который этот сайт индексирует. Но бот не может найти страницы, имеющие уровень вложенности больше трёх. Нужно помочь боту проиндексировать весь сайт.

Самый простой способ — создание страницы, в которой будут перечислены все страницы сайта и размещение на неё ссылки из подвала сайта. Идеальный кандидат на такую страницу — карта сайта в формате . Проблема в том, что не все боты утруждают себя разбором -карт. Для таких ботов карту нужно преобразовывать в формат . Далее »

Автор: , опубликовано в: SEO, комментариев: 5
7
Ноя
2010

Преобразование карты сайта в список адресов для siege

Siege — утилита для нагрузочного тестирования web-серверов, целью которой является дать разработчикам возможность проверить быстродействие/ресурсоёмкость кода в условиях, максимально приближенных к реальным.

В режимах регрессионного тестирования и «имитации Internet» siege использует текстовый файл со списком адресов для тестирования.

В качестве такого файла очень удобно было бы использовать карту сайта (sitemap), но, к сожалению, siege не понимает . В данной статье рассмотрено одно из возможных решений по преобразованию карты сайта из в текстовый формат. Далее »

Автор: , опубликовано в: Linux, комментариев: 6
11
Дек
2009