Velice provizorni forum nova media
Would you like to react to this message? Create an account in a few clicks or log in to continue.

Velice provizorni forum nova media

forum studaku novych medii
 
PříjemHledatLatest imagesRegistracePřihlášení

 

 parser webovych stranek a text analyzer

Goto down 
2 posters
AutorZpráva
jarka




Po?et p?ísp?vk? : 16
Join date : 25. 10. 07

parser webovych stranek a text analyzer Empty
PříspěvekPředmět: parser webovych stranek a text analyzer   parser webovych stranek a text analyzer Icon_minitimeMon Feb 11, 2008 5:23 pm

Ahoj lidi, s radostí se s vámi rozdělím o své koně! Oba úkoly prošly.
tady jsou:

parser
text analyzer

a tady je obsah txt (k tomu parseru)




server=http://www.idnes.cz


tag=div.art.opener h3 a


server=http://www.lidovky.cz


tag=div.art.opener h3 a


server=http://www.respekt.cz


tag=div.box.odraz h2 a


server=http://www.grafika.cz


tag=span.nadpis a
Návrat nahoru Goto down
Láďa




Po?et p?ísp?vk? : 51
Join date : 25. 10. 07

parser webovych stranek a text analyzer Empty
PříspěvekPředmět: Re: parser webovych stranek a text analyzer   parser webovych stranek a text analyzer Icon_minitimeTue Feb 12, 2008 11:22 pm

ještě přidám údaje pro další dva weby

aktuálně
server = 'http://www.aktualne.cz'
zdroj= 'div.box.otevirak.modry h3 a'

novinky
server = 'http://www.novinky.cz'
zdroj= 'div.line h2 a'
Návrat nahoru Goto down
Láďa




Po?et p?ísp?vk? : 51
Join date : 25. 10. 07

parser webovych stranek a text analyzer Empty
PříspěvekPředmět: Re: parser webovych stranek a text analyzer   parser webovych stranek a text analyzer Icon_minitimeMon Feb 18, 2008 3:21 pm

No já na to šel primitivnějš než Jarka, chyběj tam vlastní metody a pole.

Ale zase se vás to na začátku zeptá Wink

require 'net/http'
require 'hpricot'
require 'iconv'
require 'open-uri'

puts ''
puts 'Seznam serverů'.center(50)
puts ''
puts '1) iDNES.cz'
puts '2) aktualne.cz'
puts '3) lidovky.cz'
puts '4) novinky.cz'
puts ''
puts 'Zadejte číslo serveru dle seznamu!'.center(50)
puts ''

a = gets.chomp.to_i
puts ''

server=''
zdroj=''

if a == 1
server = 'http://www.idnes.cz'
zdroj= 'div.art.opener h3 a'
end

if a == 2
server = 'http://www.aktualne.cz'
zdroj= 'div.box.otevirak.modry h3 a'
end

if a == 3
server = 'http://www.lidovky.cz'
zdroj= 'div.art.opener h3 a'
end

if a == 4
server = 'http://www.novinky.cz'
zdroj= 'div.line h2 a'
end

if (a > 4) | (a < 1)
puts 'Toto není platná volba! Ukončuji program.'.center(50)
exit
end

html = Hpricot( open(server) )
titulek = html.search(zdroj).inner_html
puts 'Nejnovější zpráva je tato:'.center(50)
puts ''
puts Iconv.iconv('windows-1250', 'utf-8', titulek.center(50))
Návrat nahoru Goto down
Sponsored content





parser webovych stranek a text analyzer Empty
PříspěvekPředmět: Re: parser webovych stranek a text analyzer   parser webovych stranek a text analyzer Icon_minitime

Návrat nahoru Goto down
 
parser webovych stranek a text analyzer
Návrat nahoru 
Strana 1 z 1

Povolení tohoto fóra:Nemůžete odpovídat na témata v tomto fóru
Velice provizorni forum nova media :: Karmi - Ruby-
Přejdi na: