Mostrando postagens com marcador Web Semântica. Mostrar todas as postagens
Mostrando postagens com marcador Web Semântica. Mostrar todas as postagens

quinta-feira, 15 de março de 2012

Google implementará recursos de busca semântica este ano

Com os novos recursos de web semântica, algorítmo será capaz de entender o significado real das perguntas


Por Vinicius Aguiari, de INFO Online


O Google anunciou que estreará, nos próximos meses, recursos de web semântica em seus serviços de busca.


A afirmação foi feita pelo engenheiro-chefe da divisão de buscas da pontocom, Amit Singhal. Em entrevista ao Wall Street Journal, Singhal afirmou que o Google perseguirá um modelo de busca que torne as respostas do computador similares às que um humano daria caso ouvisse uma pergunta qualquer.


Na definição de Singhal, web semântica é uma tecnologia que interliga significados de diferentes palavras e consegue atribuir um sentido aos conteúdos publicados na internet. Na prática, o recurso funciona de modo similar a máquinas com inteligência artificial, ou seja, que conseguem tomar decisões sozinhas baseadas em padrões previamente estabelecidos.


O recurso permitirá que o computador reconheça as características de cada usuário e, de certa forma, “adivinhe” quais resultados aquela pessoa quer obter ao buscar determinadas palavras na web. O cálculo é feito a partir da análise do comportamento daquele usuário na internet.


Para que a web semântica se concretize, no entanto, será preciso que os dados publicados na internet sejam acompanhados de descrições baseadas nos padrões W3C, ou seja, que os robôs do Google sejam capazes de compreender. Por meios destes códigos, os computadores vão identificar o que representa um nome, um endereço ou uma cidade para cada tipo de pessoa.


Com essa camada adicional de conteúdo será possível a ação de programas especiais, os agentes, para lidar com informações e executar tarefas.


Um exemplo de máquina que já faz uso do recurso é o supercomputador Watson, da IBM, capaz de responder perguntas feitas por pessoas em voz alta.


O novo sistema também poderá agregar em seus resultados dados de busca social, a partir de recomendações feitas por usuários do Google e de outras redes sociais. De forma simplificada, Singhal definiu a busca semântica como uma forma “mais simples e amigável” dos usuários fazerem buscas na web. “Será como conversar com uma pessoa”, afirmou Singhal.


Apesar de o início da mudança estar programado para os próximos meses, ela levará anos para ser concluída. A principal dificuldade será evangelizar os produtores de conteúdo na web e colocar dados semânticos em seus textos, fotos e vídeos publicados na web.

sexta-feira, 1 de abril de 2011

Web semântica é o futuro das buscas na internet

Por Computerworld / EUA
IDGNow

Anunciada há anos como a evolução natural da web 2.0, tecnologia começa ganhar mercado por meio do modelo SaaS.

O sócio da empresa norte-americana de investimentos Alpha Equity Management, Vince Fioramonti, teve uma visão em 2001: ele percebeu que a web já ficara rica em informações sobre investimentos e que havia um crescente número de fornecedores oferecendo software para capturar e interpretar informações baseadas em importância e relevância.

Segundo Fioramonti, a companhia já tinha um time de analistas lendo e tentando resumir informações financeiras sobre companhias. Mas o processo era muito lento e tinha a tendência de ser subjetivo e inconsistente.

No ano seguinte, a empresa resolveu iniciar um trabalho mais qualificado com uma plataforma semântica para processar várias formas de informação digital de maneira automática, mas a primeira ferramenta utilizada proporcionava somente algoritmos gerais. A Alpha teria de investir em um time de programadores e analistas financeiros para desenvolver algoritmos específicos. Com um alto custo, o board acabou derrubando o projeto.

Segundo Fioramonti, restou à empresa recorrer a um provedor de serviços externo para tentar resolver os problemas. Mas somente em 2008 a empresa começou a ver resultados, depois assinou uma ferramenta que coleta e analisa informações de diversas fontes noticiosas, incluindo a Reuters, veículos online, jornais e blogs. Após a análise, a ferramenta pontua o sentimento do público em relação à companhia ou produto, além da sua relevância e grau de inovação. O nome do provedor de serviços é Thomson Reuters.

Os resultados são divulgados para clientes, incluindo relações públicas, profissionais de marketing, negociadores de ações e gerentes de portfólio de ações que agregam essas informações em decisões de longo prazo no tocante a investimentos.

A ferramenta não é exatamente barata. A Thomson Reuters não divulga valores, mas estimativas indicam que a assinatura mensal, que inclui atualização em tempo real das consultas, gira entre 15 mil e 50 mil dólares por mês. Mas, para uma empresa como a Alpha, o valor gerado justifica o preço. “As informações ajudaram a alavancar o desempenho do portfólio da companhia e permitiu à Alpha Equity obter diferenciais frente aos concorrentes.”

Independentemente da forma escolhida, o preço por contar com uma tecnologia de web semântica é alto. Maior ainda se a informação procurada incluir jargões, conceitos e acrônimos que forem específicos de um negócio em particular. Mas o mercado hoje já está bem mais avançado que há dez anos e oferece opções para quem se interessa por uma solução do gênero.

Entre os grandes fornecedores, Oracle, SAS e IBM possuem ofertas no contexto de suas soluções analíticas e preditivas. Mas uma série de fornecedores de menor porte, principalmente startups norte-americanas, tem algum destaque no mercado. Entre elas estão Cambridge Semantics, Expert System, Revelytix, Endeca, Lexalytics, Autonomy e Topquadrant.

Padrões da web semântica
Pensando no futuro da web semântica, o World Wide Web Consortium (W3C) determinou padrões de linguagens que devem ser seguidos na construção das páginas, como RDF, RDFS e OWL. Estes são de grande valia para as empresas de software, pois, com eles, é possível desenvolver uma série de técnicas para analisar e descrever o significado de objetos de dados e seus relacionamentos. Isso inclui um dicionário de termos genéricos e específicos da indústria, assim como análise de gramática e contexto para resolver ambiguidades idiomáticas, como palavras com múltiplos sentidos.

Para ilustrar a vantagem dos padrões, o CEO da Revelytix, Michael Lang, descreve que se todos os vendedores de produtos eletrônicos online usarem os padrões em seus catálogos, os consumidores poderão, por meio de um browser em conformidade com as regras da W3C, obter bons resultados com consultas complexas como “mostrar todas as TVs de tela plana entre 42 e 52 polegadas, organizadas por preço”.

Já existe no mercado sites que fazem esse tipo de comparação, mas não raro as informações estão desatualizadas, imprecisas ou incorretas. Ela não consegue, por exemplo, filtrar disponibilidade de tamanho ou cor, por exemplo. E a web semântica traria uma nova dinâmica nessa questão.

Para as empresas, a dinâmica é parecida. Encontrar informações qualificadas assemelha-se à essa experiência do consumidor, questão que os principais fornecedores estão buscando resolver.

Opções
Para as grandes empresas, iniciar um projeto de web semântica de imediato não é tão difícil se houver dinheiro para investir. As menores, no entanto, podem seguir a Alpha Equity e buscar um fornecedor externo que ofereça serviços semânticos.

Além da Thomson Reuters, o mercado norte-americano possui o serviço OpenCalais, também baseado em busca de agregadores de notícias, blogs, catálogos e outras aplicações.

Outros serviços vêm de empresas como DNA13, Lithium Technologies e Cymfony, todas com a mesma tendência de coletar informações na web por meio de consultas específicas e analisar notícias e a mídia social, mas com um olhar específico sobre reputação e gerenciamento de marca, gestão de relacionamento com consumidor e marketing.

(Elisabeth Horwitt)

quarta-feira, 16 de fevereiro de 2011

Web 3.0 será uma realidade em breve, diz pesquisador

Para Christian Aranha, Web 3.0 não se dará pelo humano e sim pelos computadores


Uma palestra que chamou a atenção dos participantes do TEDxRio, evento de tecnologia, conhecimento e multiplicador de boas ideias, na tarde desta terça-feira, foi a do cofundador da Cortex Intelligence e coordenador do CortexLabs, núcleo de pesquisa e inovação do Rio de Janeiro referência internacional na área de Web 3.0, Web Semântica e Inteligência Artificial, Christian Aranha.


"Estamos dentro da próxima onda da internet, a Web Semântica, que nada mais é do que o computador em um nível no qual a máquina por si só começa a interagir com outra máquina, que atingem um nível de inteligência e começam a conversar entre si e trocar informações", diz Chistian, explicando o trabalho que desenvolve na área da internet.


Ele mesmo diz que pode parecer "loucura" mas este é o futuro. "A Web 3.0 será uma realidade em breve, acredito que antes de 2020, teremos os computadores oferecendo e fornecendo um serviço mais aprimorado para o homem, algo diferente da interação atual, 2.0, humanos x humanos", afirma.

Para Christian, o Brasil ainda está longe da realidade da Web 3.0. "Aqui não tem nada, ela ainda irá existir. O Tim Berners-Lee promete isso há dez anos e nada aconteceu. É fato que teremos o controle, mas essa nova tecnologia não se dará pelo humano e sim pelos computadores, na comunicação entre eles. Um bom exemplo é o de que não navegaremos por páginas, e sim por informação. O novo Google não te levará a uma link, e sim à informação contida naquele site, o que de fato você procura", diz.

Sobre a divulgação e pesquisa na área de inteligência artificial no Brasil, ele afirma com propriedade que a área precisa de mais divulgação e investimento. "Temos produções na área de inteligência artificial, o Rio é referência, muita coisa nas faculdades precisam de incentivo e apoio. Entretanto, o que dá Ibope é o que tem apelo comercial, como por exemplo o Carnaval. Temos que rever alguns conceitos", afirma.
Ele acalma quem acredita em um domínio das máquinas. "Dificilmente elas terão o poder de se manifestar sem o controle humano. Todo controle e a codificação disso tudo é feito pela gente, sem esse perigo de uma possível revolução das máquinas", diz Christian.

Fonte: Jornal Floripa

segunda-feira, 31 de maio de 2010

Web 3.0 em dez anos é improvável, indica estudo

As previsões de que a web 3.0, a chamada web semântica (uma extensão da web atual, que permitirá aos computadores e humanos trabalharem em cooperação), se tornará realidade em 2020 têm sido vistas com certo ceticismo por observadores do mercado e internautas. Um estudo recente da consultoria Pew Research Center revela que 52% dos especialistas acreditam que a web semântica não se concretizará antes de dez anos, enquanto 47% dos usuários de internet compartilham a mesma opinião.

O estudo classifica a web 3.0 como um conceito de internet no qual os software realizarão tarefas complexas pelos usuários, levando em consideração o significado das informações transmitidas entre eles. Numa busca, por exemplo, a ferramenta conseguiria prever qual é o significado de determinada palavra que o internauta procura naquele momento e, num outro momento, o serviço de busca também conseguiria identificar outro significado para mesma palavra.

De acordo com a pesquisa, que ouviu 371 especialistas em tecnologia e 895 internautas comuns, as pessoas acreditam que "muitos fatores extremamente complicados precisam se encaixar perfeitamente" para que a web semântica se torne realidade. A maioria dos entrevistados acha que dez anos é muito pouco tempo para que "as máquinas simplifiquem todas as complicações criadas pelos seres humanos e comecem a interpretar o que pensamos".

Quando perguntados se acreditavam que essa evolução da internet pode trazer benefícios para as pessoas, a resposta foi positiva. Segundo a consultoria, quase todos os entrevistados têm certeza de que tecnologias que praticamente interpretam pensamentos trariam incontáveis oportunidades para o uso da internet, mas se mantêm céticos quanto à transformação dessas previsões em realidade até 2020.

Fonte: TI Inside

+ O Que Se Espera da Web Semântica? Pesquisa Revela Dados Interessantes

domingo, 30 de maio de 2010

Sistema de recomendação para bibliotecas digitais sob a perspectiva da web semântica


Dissertação de Mestrado defendida por Giseli Rabello Lopes na Universidade Federal do Rio Grande do Sul

Atualmente, pesquisadores e acadêmicos têm beneficiado-se muito com o crescimento acelerado das tecnologias Web, pois os resultados de pesquisa podem ser publicados e acessados eletronicamente tão logo a mesma tenha sido realizada. Esta possibilidade é vantajosa na medida em que minimiza as barreiras de tempo e espaço associadas à publicação tradicional. Neste contexto, surgem as Bibliotecas Digitais como repositórios de dados que, além dos documentos digitais propriamente ditos, ou de apontadores para estes documentos, armazenam os metadados associados. Para permitir que diferentes Bibliotecas Digitais possam interoperar surgiu a Open Archives Initiative (OAI) e, para resolver a questão da padronização dos metadados utilizados pelos repositórios, foi criado o formato Dublin Core (DC). Por outro lado, a enorme quantidade de documentos digitais disponíveis na Web tem causado o fenômeno conhecido como 'sobrecarga de informação'. Com o objetivo de suprir esta dificuldade, Sistemas de Recomendação têm sido propostos e desenvolvidos. Estes sistemas visam prover uma interface alternativa para tecnologias de filtragem e recuperação de informações, tendo como foco a predição daqueles itens ou partes da informação que o usuário acharia interessante e útil. Portanto, os Sistemas de Recomendação atuam baseados em personalização da informação sendo que as predições geralmente são realizadas utilizando-se um perfil de cada usuário. A personalização está relacionada com o modo pelo qual a informação e serviços podem ser ajustados às necessidades específicas de um usuário ou comunidade. Esta dissertação descreve um Sistema de Recomendação de artigos científicos, armazenados em bibliotecas digitais. Este sistema é dirigido à comunidade científica da área da Ciência da Computação. Tecnologicamente, o sistema proposto foi desenvolvido sob a perspectiva da Web Semântica, à medida que faz uso de suas tecnologias emergentes tais como: uso de metadados padrão para a descrição de documentos - Dublin Core, uso do padrão XML para a descrição do perfil do usuário - Currículo Lattes, e provedores de serviços e de dados (OAI) envolvidos no processo de geração das recomendações. Este trabalho ainda apresenta e discute alguns resultados de experimentos baseados em avaliações quantitativas e qualitativas de recomendações geradas pelo sistema.


Clique aqui para o texto completo [pdf - 69 p. ]
Imagem: Internet

quarta-feira, 31 de março de 2010

Zitigo: nasce o primeiro buscador semântico do Chile


Proyecto fue creado por un grupo de porteños

Hoy se inaugura el primer Buscador Semántico Chileno, que con un formato nuevo en el mundo, orienta búsquedas a temáticas y necesidades específicas, segmentando a un país geográficamente y entregando información tanto por ciudades como a nivel nacional.

Zitigo.cl fue creado en base a íconos y mapas, de manera que los limitantes del lenguaje y accesos, no sean barreras para encontrar resultados en cualquier lugar de Chile. “Fundamentalmente, la nueva herramienta cubrirá necesidades tanto para chilenos como extranjeros, así como también proporcionar un abanico de posibilidades no contempladas por la individualidad de cada persona”, asegura Patricio Olivares, creador de esta iniciativa.

Según Olivares, “la intención es que - por ejemplo - si viajas a alguna parte y necesitas comer o dormir, tengas un abanico de posibilidades locales, entre las cuales estarán las que nunca contemplaras, pudiendo conocer la pollona y el curanto, o increíblemente dormir en eco-cabañas en la mitad de Las Torres del Paine o recorrer las viñas en un tren en la zona centro”.

Además, Zitigo.cl se diseñó para facilitar la navegación por “Touch Screen”, y como aseguran sus creadores, se preparó para responder a pantallas táctiles cuando se masifique a nivel nacional. “Solo resta activar el funcionamiento, ya que todo fue estructurado para habilitar los “Touch´s” y desvincularnos del teclado como a futuro será la tendencia”, manifestó.

Actualmente, Zitigo.cl contempla 21 ciudades de Chile y está segmentado en 10 necesidades fundamentales para el ser humano. “Dividimos la información por íconos de carácter amplio, pudiendo encontrar en “comida” supermercados, reparto de verduras y frutas, y despachos a domicilio de variados platos; como también en el ícono de “salud” encontrar laboratorios, farmacias, ambulancias y atención a domicilio. Adicionalmente, a la información de webs de emergencia, se incluyeron las direcciones y números de teléfonos de cada uno”.

Así, Olivares sostuvo que “esperamos que la gente utilice Zitigo.cl, ya que es un esfuerzo de muchos chilenos por mejorar los sistemas de información y servicios en el país”.

“Con este nuevo buscador queremos fortalecer la identidad de Chile en Internet y posicionar social-culturalmente el sello nacional de cada página en el ciberespacio. Algo muy parecido a lo que hace Francia hoy con su red”. “Hay un mensaje en todas estas webs, que es muy positivo y alentador, donde Internet es una herramienta potente de desarrollo socio-económico para nuestro país. Tenemos que contemplarlo”, concluyó.

Fonte: La Estrella

terça-feira, 27 de outubro de 2009

Nova biblioteca digital de Web semântica


A primeira biblioteca digital de Web semântica italiana foi apresentada oficialmente em Milão.

Criada no âmbito do projecto «ICT Milano Città Cablata - Biblioteca Aperta di Milano», a nova biblioteca consiste numa infra-estrutura tecnológica que permite aos cibernautas acederem a conteúdos culturais digitalizados associados a informação que determina o seu contexto semântico.

Os primeiros documentos disponibilizados na plataforma dizem respeito a música milanesa do século XIX, detidos por várias instituições públicas da cidade. Com esta iniciativa, as autoridades de Milão pretendem facilitar o acesso a estes documentos por parte de investigadores.


Fonte: IGov

quinta-feira, 8 de outubro de 2009

Agora só falta organizar o conteúdo relevante

Pela organização do conteúdo relevante do processo colaborativo: já agrupamos por tags, assuntos ou perfil de usuário e o próximo passo é saber entregar isso de forma pertinente.

Por Flavio Vidigal

Que relevância de conteúdo é a bola da vez, disso já se fala há muito tempo, é chover no molhado mesmo. Mas a discussão que quero levantar aqui é: de quem é a responsabilidade de organizar todo conteúdo jogado na web até agora?

O fenômeno web 2.0 já passou e ninguém viu. O que faremos com todo esse conteúdo produzido? Tendo em vista que a busca pelo conteúdo relevante já é uma prática que vem do usuário, em que ele vai atrás de vídeos, posts e fotos que lhe agradam mais, quando a web vai entender seus anseios e apresentar primeiramente resultados referentes a um determinado perfil de navegação?

Enquanto a web semântica não chega, ou seja, uma padronização que ajude tanto humanos quanto computadores a organizar o conteúdo e entregá-lo de forma relevante ao usuário final o que podemos fazer com relação a este assunto?

O Google tem a informação na mão, mas será que é dele a responsabilidade de organizar e difundir isso? Seriam os veículos? Nós criativos? Algum órgão do governo?

Acredito muito em fenômenos emergentes e acho que não estamos à altura de ditar quem vai fazer o quê no meio digital hoje. O que podemos é tomar parte deste fenômeno e fazer alguma coisa de útil. Isso sim pode partir de qualquer um.

Já temos conteúdo suficiente para agruparmos por tags, assuntos ou perfil de usuário, basta ser criativo e saber como entregar isso de forma pertinente. O que fazemos hoje quando queremos ver filmes das copas passadas de futebol? Uma opção é ir até o acervo da Globo ou procurar “copas” no You Tube. Mas se deu vontade de ler sobre esse assunto, lá vou eu no Google atrás de blogs, assim ocorre com fotos no Flickr etc.

O que se pode fazer são agregadores de APIs para que o usuário tenha tudo na mão em tempo real e de forma organizada.

Imagine o exemplo da copa, se tivéssemos um site que reunisse todos os resultados do Twitter pela tag “#Copa”, os vídeos do You Tube, as imagens do Flickr, as notícias relacionadas e mais comentadas etc.

Divulgaríamos esse site por perfil de navegação uma vez que sabemos que na proximidade deste evento a busca pelo assunto aumenta significativamente e então apresentaríamos ele às pessoas que digitassem “copa do mundo” nos buscadores, por exemplo.

Parece óbvio e até já temos alguns sites e aplicativos que fazem isso. Mas poderíamos comprar essa ideia e tentar viabilizar cada vez mais esse fenômeno, sem precisarmos estimular a colaboração ainda mais, pois isso já está implícito na cultura digital de cada um de nós. Acredito na bandeira da organização e entrega de conteúdo relevante de todo processo colaborativo que houve e que ainda está acontecendo.

Fonte: Webinsider

quinta-feira, 6 de agosto de 2009

A web do futuro é semântica?

Maurício Moraes


A construção de uma internet mais inteligente caminha devagar, mas pode provocar uma revolução.

Esqueça o Google. Se a web semântica virar mesmo realidade, o futuro estará repleto de agentes — programas capazes de pesquisar informações e executar tarefas complexas, que, hoje, apenas os humanos conseguem realizar. Um exemplo: usar a rede para alugar um apartamento em São Paulo, num prédio sem restrições a cachorros, numa rua com baixo índice de criminalidade e a, no máximo, 20 minutos de carro do trabalho. Hoje, uma pesquisa desse tipo exige que o internauta passe algumas horas diante do PC. É necessário visitar vários sites, decidir quais informações têm maior ou menor relevância e tirar conclusões. Com a web semântica, todo o trabalho duro ficará sob a responsabilidade de aplicativos. Eles não apenas conseguirão dar a resposta em poucos segundos como também serão capazes de entrar em contato com as imobiliárias.

Quem idealizou esse cenário foi o pai da web, o físico Tim Berners-Lee, diretor do World Wide Web Consortium (W3C). Mas o projeto de uma internet mais inteligente, que surgiu há mais de dez anos, até agora não decolou. Apesar de padrões e modelos já terem sido definidos e criados há algum tempo, ainda são poucos os sites moldados dentro dos novos parâmetros. Enquanto isso, buscadores como o Google continuam indispensáveis. O que aconteceu?

Teia na rede

Não dá para entender por que a web semântica ainda não se tornou um grande sucesso sem compreender o seu funcionamento. São muitas as diferenças em relação à rede atual. A internet de hoje consiste numa imensa quantidade de documentos, que só se relacionam entre si por meio de links. Quando leem o código de uma página, os computadores veem apenas um punhado de instruções que indicam como exibi-la de modo correto.

No caso de uma livraria virtual, as máquinas não sabem diferenciar preço, título ou autor. Num site pessoal que exibe uma biografia, também não conseguem distinguir a cidade onde a pessoa nasceu das empresas onde trabalhou. Para um computador, cada aspecto desse conteúdo se resume a um conjunto de caracteres. Já a mente humana consegue perceber claramente cada elemento e seu significado.

A web semântica tem o objetivo de fazer os computadores também entenderem o que está descrito nas páginas da web. Na visão de Tim Berners-Lee e de outros pesquisadores, realizar essa mudança radical não exige a criação de complexos programas de inteligência artificial. O grande segredo está em produzir páginas que contenham, no seu código, informações capazes de indicar, às máquinas, o que representa cada item presente.

Para que a web semântica se concretize, é preciso que os dados sejam acompanhados de descrições baseadas nos padrões do W3C. Entre esses padrões, os principais são XML, RDF e ontologias (veja o glossário na página 60). Por meio desses códigos, os computadores vão identificar o que representa um nome, um endereço, uma cidade e assim por diante. Eles não vão se tornar mais espertos e realmente compreender, como o cérebro humano, o significado de cada coisa. Mas essa camada adicional de conteúdo permitirá a ação de programas especiais, os agentes, para lidar com informações e executar tarefas.

Admirável mundo novo
Berners-Lee e os pesquisadores James Hendler e Ora Lassila descreveram o que esperavam da web semântica num artigo publicado em 2001 na revista Scientific American (http://tinyurl.com/dytfbz ). No texto, que se tornou referência, os agentes não estão presentes apenas em computadores, mas também em dispositivos móveis. Logo no início, um telefone toca e o volume de todos os aparelhos sonoros é diminuído automaticamente. Depois, um programa recebe a missão de agendar sessões de fisioterapia. E seguem vários outros exemplos semelhantes.

Hendler, hoje professor do Instituto Politécnico Rensselaer, nos Estados Unidos, disse à INFO que faria poucas alterações no artigo original. "Teria deixado mais claro de que falávamos de semântica realmente muito simples e enfatizado o quanto ela pode nos levar longe", afi rma. "Muitos pensam que a web semântica depende de inteligência artificial, mas estão errados. Tem muito mais a ver com bancos de dados e aplicativos para a web."

Para o pesquisador, não é possível dizer que essa nova internet ainda não emplacou. "Programas na web que aplicam essas tecnologias em larga escala já existem há mais de dois anos, e muitos outros continuam a surgir", diz. "É uma tecnologia ligada à infraestrutura. As pessoas esperam ‘vê-la’, mas o que ela realmente tem feito é permitir que os desenvolvedores enriqueçam seus sites e integrem melhor as informações de diferentes páginas."

Para Vagner Diniz, coordenador-geral do escritório brasileiro do W3C, uma verdadeira revolução está prestes a acontecer. "Pelas experiências que temos visto, haverá uma mudança radical", afirma. "Mas isso não quer dizer que as velhas tecnologias vão deixar de funcionar." A web atual e a semântica vão, portanto, coexistir — daí a resistência de muitos pesquisadores em se referir a esse novo cenário pelo termo web 3.0. "Cada vez mais, os sites estão em conformidade com os novos padrões", diz Carlos Cecconi, analista de projetos do W3C no Brasil.

Dados invisíveis

Se a maioria das páginas da internet já incorporasse a lógica da web semântica, os buscadores poderiam oferecer resultados mais precisos e complexos. A equipe do recém-lançado Wolfram Alpha (http://info.abril.com.br/web20/322.shtml ) teve de construir, de modo quase artesanal, uma base de dados de onde o serviço tira todas as suas respostas. Para garantir a confiabilidade das informações, elas não são extraídas em tempo real da rede. Mas, se a maior parte da internet já incorporasse os novos padrões e modelos do W3C, o processo seria quase todo automatizado.
Apesar de a web semântica trazer benefícios, sua adoção ampla continua sendo uma promessa. "É a natureza humana", afirma Jon McLoone, desenvolvedor sênior da Wolfram Research. "Marcar as páginas exige esforço e, para muitos sites, não há recompensa." Ele vê, ainda, um alto grau de complexidade na tarefa, que poderia ser eliminado se ferramentas pudessem cuidar sozinhas da maior parte do trabalho. "Sem isso, a web semântica pode acontecer no ano que vem ou nunca", diz

A automatização parcial do processo também é vista como alternativa por Renato Fileto, professor da Universidade Federal de Santa Catarina (UFSC). "Uma das grandes dificuldades é a construção de ontologias", diz. Segundo ele, isso poderia ser facilitado por meio de aplicações baseadas em inteligência artificial. Fileto também acredita que ainda existe uma barreira no mundo corporativo. "Muitas vezes as empresas se recusam a adotar padrões por interesses comerciais", afirma.

Mas há lugares em que a web semântica está se tornando cada vez mais popular: as intranets. "Ali, ela está crescendo", diz José Parente de Oliveira, professor do Instituto Tecnológico de Aeronáutica (ITA). Sua adoção pode ter futuro também em outras áreas. Parente acha que as descrições semânticas podem ajudar a criar sistemas de análise de situação. Isso seria útil, por exemplo, no controle do tráfego aéreo. "Na internet, as coisas são mais lentas para acontecer", afirma o pesquisador. "As empresas precisam ver os benefícios que a web semântica traz", diz.
Vocabulário semântico

Conheça os principais padrões da web semântica:

XML (EXTENDED MARKUP LANGUAGE):

Linguagem para intercâmbio de dados. Permite, por exemplo, a criação de tags.

RDF (RESOURCE DESCRIPTION FRAMEWORK):
acrescenta contexto aos dados por meio de trios, marcadores semelhantes a sujeito, verbo e objeto de uma frase.

ONTOLOGIA:
descrição de termos e das relações semânticas entre eles. Permite identificar conceitos similares descritos de forma diferente.

Fonte: Info

"A web semântica é perda de tempo"

Peter Gärdenfors, professor de Ciência Cognitiva da Universidade Lund, na Suécia, é um crítico feroz da maneira como o W3C vem conduzindo a implantação da web semântica. Veja o que ele disse à INFO.

INFO - A web semântica vai se concretizar?
GÄRDENFORS - Não do modo como imaginaram Berners-Lee e seus seguidores. Na minha opinião, esse é o caminho errado. Os padrões do W3C estão todos baseados em representações semânticas carregadas de formalismo.

INFO - Que problemas isso traz?
GÄRDENFORS - Há muita dificuldade em representar a similaridade de conceitos. No pensamento racional humano, isso é fundamental. Mas foi subestimado na tradição da web semântica. Na minha opinião, um modelo geométrico de conceitos que permita representar similaridade por meio de distâncias no espaço seria mais adequado. Também há outras técnicas, como a análise semântica latente.

INFO - É trabalhoso construir sites com XML, RDF e ontologias?
GÄRDENFORS - Acredito que usar esses padrões é perda de tempo.

Fonte: Info

quarta-feira, 5 de agosto de 2009

Yebol, mecanismo de busca semântica, promete mais eficiência que Google



Site usa combinação de algoritmos e conhecimento humano e está em fase beta, mas já realiza buscas em mais de 10 milhões de expressões.

Depois da estreia do Bing, mecanismo de buscas da Microsoft, e, antes, do Wolfram Alpha, outro mecanismo de busca entra ao mercado. A bola da vez é o Yebol, site de buscas semânticas que promete oferecer resultados mais relevantes que o Google, o líder do segmento com mai de 65% de participação do mercado, de acordo com dados da comScore.

Por ora, o site está em fase beta, mas já consegue fornecer resultados para mais de 10 milhões de expressões. O Yebol promete ainda apresentar resultados para “qualquer expressão já concebida” em um prazo entre três e seis meses. Para isso, o mecanismo usará uma combinação de algoritmos e conhecimento humano para criar um diretório web gigantesco.

As buscas feitas a partir do Yebol apresentam, além dos tradicionais links para outros sites, outras buscas relacionadas, resultados no Twitter e mostra quais os principais sites sobre um determinado assunto. “O Yebol vai libertar as pessoas das listas que são as buscas na web, sem sacrificar a quantidade de conteúdo”, disse o diretor de comunicação do site, Grant Landis.

Megan Burger, editora da PC Advisor

Fonte: IDGNow

sexta-feira, 27 de março de 2009

Tecnologia semântica em buscas do Google


O Google anunciou que integrou ao seu sistema de busca uma tecnologia de semântica, o que permitirá ao site associar as palavras buscadas a outras de significado parecido, para melhorar a procura feita pelos usuários.

"Haverá mais perguntas, mais linguagens, e fazemos nossas sugestões do que é mais relevante para a necessidade do internauta atualmente", escreveram os engenheiros no blog oficial do Google.

Segundo a empresa, chamada "busca semântica" será habilitada em 37 idiomas.

Web 3.0

O interesse pelas "buscas semânticas" tem crescido para criar sistemas mais inteligentes que procuram interpretar e compreender o significado de sentenças ou combinações de palavras.

Em janeiro, durante uma conferência financeira, o CEO do Google, Eric Schmidt, já havia dado indícios da novidade, alegando que a companhia teria uma postura mais séria a respeito da busca semântica. "Não seria legal se o Google entendesse o sentido da sua frase, invés de apenas palavras que compõem a frase? Fizemos muitas descobertas nessa área que deveremos lançar logo", disse ele na ocasião.

E não é só o Google que vem trabalhando nisso. A principal rival do Google em um suposto mercado semântico de busca, a PowerSet, foi adquirida pela Microsoft em julho por 100 milhões de dólares para melhorar os conceitos semânticos por trás do Windows Live Search.

Recentemente a gigante dos softwares confirmou que está testando o seu sistema de buscas Kumo.com.

Fonte: Olhar Digital / France Press

terça-feira, 20 de maio de 2008

Motor de busca semântico disponível em versão beta

Os cibernautas já podem testar o novo motor de busca Powerset. Este motor de busca afasta-se da convencional tecnologia de palavras chave, tendo sido desenhado para entender o significado das páginas Web. O Powerset surge, por isso, com a promessa de alterar a forma como se fazem pesquisas na Web ao oferecer - em teoria uma experiência de pesquisa mais inteligente e eficiente. A versão beta que foi colocada online consegue resultados que têm impressionado alguns observadores, mas ainda tem um alcance e um índice de páginas muito reduzido, o que coloca algumas dúvidas sobre a sua capacidade de competir à escala do motor de busca da Google.

Os motores de busca tradicionais, como o Google, realizam as suas pesquisas através de palavras chave, tratando as páginas Web como “caixas de palavras” e indexando o seu conteúdo sem compreender o seu significado. É precisamente isto que o Powerset pretende mudar, ao recorrer a tecnologia proprietária e a tecnologia licenciada pela PARC (subsidiária da Xerox) para criar uma representação semântica ao analisar sintacticamente cada frase para dela extrair o seu significado. “Estamos a mudar a forma como a informação é pesquisada ao fazer uma análise muito mais profunda às páginas que indexamos”, afirmou Scott Prevost, director de produtos da Powerset.

Para já, o índice do Powerset é muito limitado, tendo apenas alguns milhões de páginas da Wikipedia e da Freebase da Metaweb Technologies, uma estrutura de base de dados para informação baseada em Web. No entanto, Prevost prevê que o índice comece a expandir-se no espaço de um mês após o seu lançamento, e que eventualmente venha a rivalizar com os índices do Google, do Yahoo e de outros.

Fonte: Computerworld Portugal


"Nem todos para os quais o cão late são ladrões"
Máxima hassídica

segunda-feira, 12 de maio de 2008

Empresa cria busca semântica para Wikipedia

A Powerset revelou nova ferramenta de busca para a Wikipedia.

A busca usa frases convencionais em lugar de termos de busca, o que marca o primeiro passo em seu desafio a serviços de busca na web estabelecidos, como o Google.

A tecnologia da Powerset classifica o significado de palavras e sentenças na forma de conceitos relacionados, liberando os usuários da necessidade de saber que termos exatos desejam encontrar.

A empresa iniciante do Vale do Silício vem sendo observada com atenção e vai oferecer uma maneira de realizar buscas entre os milhões de verbetes da enciclopédia online Wikipedia, o que ajudaria os usuários a encontrar respostas detalhadas a perguntas e não links isolados que tornam novas buscas necessárias.

Por exemplo, um usuário que deseje saber quantas mulheres teve o rei inglês Henrique 8 (seis, ou duas, a depender de sua definição de casamento) pode encontrar uma resposta via serviço Powerset em http://tinyurl.com/5qpcr9/ .

A Powerset quer saltar por sobre a geração atual de serviços que dependem de termos de buscas, como os do Google, Yahoo, Microsoft e o Ask.com, da IAC InterActiveCorp.

"A Wikipedia está se tornando um microcosmo das partes mais úteis da Internet", disse Greg Sterling, analista de Internet da Sterling Market Intelligence. "Isso oferece uma ferramenta poderosa para encontrar o que você esteja procurando nesse subconjunto da Web."

Embora ainda muito distante de permitir que usuários realizem buscas na Web como um todo, a Powerset está usando a Wikipedia para demonstrar de que maneira sua tecnologia pode ser usada para buscar grande número de sites por meio de frases ou perguntas formuladas da maneira convencional.

Com o tempo, ela pretende formar parceria com outros sites de alta qualidade nos quais a informação possa ser organizada em forma de pergunta e resposta, de maneira a se enquadrar as técnicas de busca que desenvolveu.
Os exemplos podem incluir informações financeiras, pedidos de patentes, o CIA Factbook ou clones inspirados pela Wikipedia, disseram dirigentes da empresa.


Fonte: Info Online

"Não podemos conhecer nada de exterior a nós superando nós mesmos (...) o Universo é o espelho em que podemos contemplar apenas o que aprendemos a conhecer em nós" Italo Calvino