Главная
Новости
Статьи и обзоры
Горожанин
Обнинск в Internet
Web Design
Hardware
Software
Безопасность
Серфинг
Игродром
Relax
Технологии
Web-обзор
Интернет-ликбез
Опросник
УП-Технологии
ART.net
Ссылки
Архив
О нас
Контакты
Форумы
Основатель: К.Николаенко
Главный Редактор: С.Коротков
Web Design: Neutron
|
|
= Web-Дизайн =
С МИРУ ПО НИТКЕ!
Матвей Хорошилов lightnet@obninsk.ru
взято с www.iworld.ru
Автоматическое обновление своих сайтов было заветной мечтой многих веб-мастеров. Как хорошо, что посетители всегда смогут читать свежие новости и это не потребует ни малейших усилий со стороны владельца сайта! Техническая реализация этой полезной функциональности не представляет никаких затруднений. Вполне подходит для этого такой распространенный в среде веб-мастеров инструмент, как РНР.
Рассмотрим тривиальную задачу, заключающуюся в публикации на вашем сайте текущего курса доллара. Для начала следует определиться с источником информации. курс доллара в Интернете публикуется практически везде, например, на главной странице агентства "рос-Бизнес-Консалтинг" (www.rbc.ru). Среди представленных там многочисленных показателей выбираем курм ЦБ.
Импортирование информации из внешних источников - достаточно распространенный прием, применяемый многими веб-мастерами. Эта информация извлекается непосредственно из HTML-страниц поставщиков контента, и технология извлечения очень проста.
Прежде всего следует тщательно изучить структуру исходного документа и найти в нем интересующие нас сведения (в простейшем случае они будут представлены обычной текстовой строкой). Затем нужно записать фрагменты HTML-кода до и после полезных данных таким образом, чтобы эти фрагменты однозначно идентифицировали их местоположение в документе. Программа, импортирующая информацию из внешнего источника, должна загрузить оттуда HTML-страницу целиком, просканировать ее на наличие указанных фрагментов и взять для дальнейшей обработки то, что находится между ними. Кроме того, для того чтобы не просматривать всю страницу, имеет смысл определить также границы блока, в рамках которого будет осуществляться поиск.
Просматривая код главной страницы "Рос-Бизнес-Консалтинга" www.rbc.ru/index.html (листинг 1),
..................................................................
Листинг 1. www.rbc.ru/index.html (фрагмент)
<TD><a href="http://stock.rbc.ru/demo/cb.0/daily/USD.rus.shtml?show=3M">
<FONT COLOR= "#333333" SIZE="-2>USD ЦБ РФ</FONT></a></TD>
<TD ALIGN="RIGHT"><FONT SIZE="-2">06/03</FONT></TD>
<TD ALIGN="RIGHT"><FONT SIZE="-2"> 30,9909</FONT></TD>
<TD ALGIN="RIGHT"><FONT SIZE="-2" COLOR="red">-0,004</FONT></TD>
...................................................................
находим интересующую нас фразу "USD ЦБ РФ", наличие которой является неплохим признаком начала информационного блока. Смущает, правда, то обстоятельство, что эта последовательность символов запросто может промелькнуть и в тексте новостей, представленных на той же странице. Поэтому имеет смысл использовать в качестве ключевой фразы чуть более расширенный фрагмент, вероятность обнаружения которого в основном тексте намного меньше - "USD ЦБ РФ</FONT>".
Текущее значение курса доллара находится во второй строке после выбранной нами ключевой фразы. Определим фрагменты HTML-кода, стоящие до и после полезных данных:
До: <FONT SIZE="-2">
После:</FONT>
Окончательно определившись со структурой документа, можно приступать непосредственно к написанию текста программы.
Продолжение в следующем номере.
|
|