jarka
Po?et p?ísp?vk? : 16 Join date : 25. 10. 07
| Předmět: parser webovych stranek a text analyzer Mon Feb 11, 2008 5:23 pm | |
| Ahoj lidi, s radostí se s vámi rozdělím o své koně! Oba úkoly prošly. tady jsou: parsertext analyzera tady je obsah txt (k tomu parseru) server=http://www.idnes.cz tag=div.art.opener h3 a server=http://www.lidovky.cz tag=div.art.opener h3 a server=http://www.respekt.cz tag=div.box.odraz h2 a server=http://www.grafika.cz tag=span.nadpis a | |
|
Láďa
Po?et p?ísp?vk? : 51 Join date : 25. 10. 07
| Předmět: Re: parser webovych stranek a text analyzer Tue Feb 12, 2008 11:22 pm | |
| ještě přidám údaje pro další dva weby
aktuálně server = 'http://www.aktualne.cz' zdroj= 'div.box.otevirak.modry h3 a'
novinky server = 'http://www.novinky.cz' zdroj= 'div.line h2 a' | |
|
Láďa
Po?et p?ísp?vk? : 51 Join date : 25. 10. 07
| Předmět: Re: parser webovych stranek a text analyzer Mon Feb 18, 2008 3:21 pm | |
| No já na to šel primitivnějš než Jarka, chyběj tam vlastní metody a pole. Ale zase se vás to na začátku zeptá require 'net/http' require 'hpricot' require 'iconv' require 'open-uri'
puts '' puts 'Seznam serverů'.center(50) puts '' puts '1) iDNES.cz' puts '2) aktualne.cz' puts '3) lidovky.cz' puts '4) novinky.cz' puts '' puts 'Zadejte číslo serveru dle seznamu!'.center(50) puts ''
a = gets.chomp.to_i puts ''
server='' zdroj=''
if a == 1 server = 'http://www.idnes.cz' zdroj= 'div.art.opener h3 a' end
if a == 2 server = 'http://www.aktualne.cz' zdroj= 'div.box.otevirak.modry h3 a' end
if a == 3 server = 'http://www.lidovky.cz' zdroj= 'div.art.opener h3 a' end
if a == 4 server = 'http://www.novinky.cz' zdroj= 'div.line h2 a' end
if (a > 4) | (a < 1) puts 'Toto není platná volba! Ukončuji program.'.center(50) exit end
html = Hpricot( open(server) ) titulek = html.search(zdroj).inner_html puts 'Nejnovější zpráva je tato:'.center(50) puts '' puts Iconv.iconv('windows-1250', 'utf-8', titulek.center(50)) | |
|
Sponsored content
| Předmět: Re: parser webovych stranek a text analyzer | |
| |
|