Еженедельник Свет в Интернет

Главная

Новости

Статьи и обзоры
  Горожанин
  Обнинск в Internet
  Web Design
  Hardware
  Software
  Безопасность
  Серфинг
  Игродром
  Relax
  Технологии
  Web-обзор
  Интернет-ликбез
  Опросник
  УП-Технологии
  ART.net

Ссылки

Архив

О нас

Контакты

Форумы


Основатель:
К.Николаенко

Главный Редактор:
С.Коротков

Web Design:
Neutron


Наш спонсор






Порт POPULAR.RU
POPULAR.RU RegionalBanner Network.






Океан


НПП Метра - промышленные электронные автомобильные вагонные весы
Goldy Interior - салон офисной мебели: кабинеты руководителей, мебель для персонала

= Web-Дизайн =

 

С МИРУ ПО НИТКЕ!

Матвей Хорошилов lightnet@obninsk.ru
взято с www.iworld.ru

Автоматическое обновление своих сайтов было заветной мечтой многих веб-мастеров. Как хорошо, что посетители всегда смогут читать свежие новости и это не потребует ни малейших усилий со стороны владельца сайта! Техническая реализация этой полезной функциональности не представляет никаких затруднений. Вполне подходит для этого такой распространенный в среде веб-мастеров инструмент, как РНР.

Рассмотрим тривиальную задачу, заключающуюся в публикации на вашем сайте текущего курса доллара. Для начала следует определиться с источником информации. курс доллара в Интернете публикуется практически везде, например, на главной странице агентства "рос-Бизнес-Консалтинг" (www.rbc.ru). Среди представленных там многочисленных показателей выбираем курм ЦБ.
Импортирование информации из внешних источников - достаточно распространенный прием, применяемый многими веб-мастерами. Эта информация извлекается непосредственно из HTML-страниц поставщиков контента, и технология извлечения очень проста.
Прежде всего следует тщательно изучить структуру исходного документа и найти в нем интересующие нас сведения (в простейшем случае они будут представлены обычной текстовой строкой). Затем нужно записать фрагменты HTML-кода до и после полезных данных таким образом, чтобы эти фрагменты однозначно идентифицировали их местоположение в документе. Программа, импортирующая информацию из внешнего источника, должна загрузить оттуда HTML-страницу целиком, просканировать ее на наличие указанных фрагментов и взять для дальнейшей обработки то, что находится между ними. Кроме того, для того чтобы не просматривать всю страницу, имеет смысл определить также границы блока, в рамках которого будет осуществляться поиск.
Просматривая код главной страницы "Рос-Бизнес-Консалтинга" www.rbc.ru/index.html (листинг 1),

..................................................................
Листинг 1. www.rbc.ru/index.html (фрагмент)

<TD><a href="http://stock.rbc.ru/demo/cb.0/daily/USD.rus.shtml?show=3M">
<FONT COLOR= "#333333" SIZE="-2>USD ЦБ РФ</FONT></a></TD>
<TD ALIGN="RIGHT"><FONT SIZE="-2">06/03</FONT></TD>
<TD ALIGN="RIGHT"><FONT SIZE="-2"> 30,9909</FONT></TD>
<TD ALGIN="RIGHT"><FONT SIZE="-2" COLOR="red">-0,004</FONT></TD>

...................................................................


находим интересующую нас фразу "USD ЦБ РФ", наличие которой является неплохим признаком начала информационного блока. Смущает, правда, то обстоятельство, что эта последовательность символов запросто может промелькнуть и в тексте новостей, представленных на той же странице. Поэтому имеет смысл использовать в качестве ключевой фразы чуть более расширенный фрагмент, вероятность обнаружения которого в основном тексте намного меньше - "USD ЦБ РФ</FONT>".
Текущее значение курса доллара находится во второй строке после выбранной нами ключевой фразы. Определим фрагменты HTML-кода, стоящие до и после полезных данных:
До: <FONT SIZE="-2"> 
После:</FONT>

Окончательно определившись со структурой документа, можно приступать непосредственно к написанию текста программы.

Продолжение в следующем номере.

Copyright © Свет в Internet   Designed by Свет в Internet