Microsoft pagará US$ 50 milhões por ano ao Yahoo durante 3 anos

agosto 5, 2009 by admin · Leave a Comment
Filed under: Noticias, Tecnologia 

A Microsoft pagará 50 milhões de dólares por ano, durante três anos, e contratará ao menos 400 funcionários do Yahoo como parte do recente acordo na área de buscas anunciado pelas duas companhias na semana passada. O pagamento pode ser usado pelo Yahoo para cobrir despesas de transição e implementação dos termos do contrato.

As informações são de um documento da Securities and Exchange Commission, órgão que regulamenta o mercado de valores norte-americano e tem atuação semelhante à Comissão de Valores Mobiliários brasileira, colocado na internet. Em cinco dos dez anos de duração do acordo, a Microsoft poderá optar por engajamento exclusivo nas vendas de serviços de publicidade da companhia de internet, aponta o documento.  Nesse caso, o Yahoo vai embolsar 93% da receita gerada pela busca do site – que passa a usar o Bing, da Microsoft – em vez de apenas 88%.

Se a Microsoft não fechar um acordo exclusivo, a parte do Yahoo na receita será de, no máximo, 90%.

Alguns termos inclusos no documento podem tirar o Yahoo do negócio. Um deles seria o desempenho da receita média anual em buscas do Bing nos Estados Unidos se manter abaixo de uma determinada porcentagem na receita estimada pela busca do Google.

O Yahoo pode também sair do negócio se a Microsoft decidir fechar seu negócio de buscas – vendendo a unidade para outra companhia, por exemplo. Nesse caso, o Yahoo teria a prioridade de aquisição.

O negócio entre as companhias deve ser finalizado no dia 27 de outubro e a estimativa é que o período de implementação dure dois anos – esse prazo pode ser estendido pelo Yahoo se for necessário lidar com aprovações antitruste.

Fonte: IDGNow

Busca fácil on Rails

dezembro 18, 2008 by admin · Leave a Comment
Filed under: Programação, Ruby on Rails 

Após algumas buscas e testes encontrei um projeto chamado Searchlogic. A primeira impressão foi muito boa: de cara já vejo o projeto com uma ampla documentação disponível. Bastaram algumas linhas de código para conseguir o que eu queria!

Com base nesse resultado positivo, resolvi compartilhar aqui a minha experiência fazendo uma pequena explicação sobre como integrar o Searchlogic ao seu site.

Passo 1: Instalação do Searchlogic: Você pode fazer a instalação usando o RubyGems ou instalando com um plugin dentro do seu projeto.

Instalação como gem:

sudo gem install searchlogic

# e depois adicione ao config/environment.rb
config.gem "searchlogic" 

Instalação como plugin:

script/plugin install git://github.com/binarylogic/searchlogic.git

Passo 2: Faça a busca! É isso mesmo, já está “tudo no jeito” para você fazer a sua busca. Uma busca simples seria:

@search = Model.new_search( params[:q] )
@items, @items_count = @search.all, @search.count

O que esse código faz é buscar registros a partir do seu modelo (Model no exemplo) e colocar o resultado em duas variáveis: uma com a coleção de registros e outra com a quantidade retornada. Mais fácil impossível.

Passo 3: Personalizando sua busca: se você quiser, e você provavelmente quer, você pode especificar quais campos devem ser pesquisados ou quais as condições devem ser atendidas. Tudo isso é muito simples de ser feito e pode ser definido de duas formas: você pode usar um hash com as opções e condições (similar ao que fazemos com o tradicional find) ou uma abordagem mais orientada a objetos. Exemplos simulando uma busca de carros:

Passando um hash:

Car.all(
  :conditions => {
    :name_contains => 'ford', # name like '%ford%'
  },
  :per_page => 10
  :page => params[:page],
   :o rder_by => 'year',
   :o rder_as => 'DESC',
)

Ou como um objeto:

search = Car.new_search
search.conditions.name_contains = 'ford'
search.per_page = 10
search.page = params[:page]
search.order_by = 'year'
search.order_as = 'DESC'
search.all # execute

Simples não? E isso é só o começo, na documentação do projeto há muitos outros exemplos e possibilidades!

Como o Google entende seu texto

novembro 28, 2008 by admin · Leave a Comment
Filed under: Tecnologia 

Se você gosta de Web Writer, essa é uma boa hora para conhecer como os mecanismos de busca processam o seu texto, e como você pode escrever um bom texto entendendo essa lógica. Esses conceitos são conhecidos por poucas pessoas aqui no Brasil, então sinta-se privilegiado ao final da leitura.

Não serei muito técnico para não deixar o texto cansativo, todos os conceitos que explicarei abaixo vou dar exemplos práticos como influem diretamente no seu HTML.

Para começar você deve saber o que é IR (Information retrieval) ou Recuperação da Informação para nós. É uma área da Ciência da Informação que está por trás do tratamento e busca por dados e meta dados em documentos.

É de fundamental importância que analistas SEO e SEM entendam os princípios básicos de IR para não bolarem teorias mirabolantes sem base técnica, como acontece e muito nos Estados Unidos. Muitos profissionais de Marketing sem conhecimento de Ciência da Informação bolam teorias de SEO com base em testes, só que montar uma teoria somente por percepção abre uma grande brecha para erros e dupla interpretação.

Etapas de Representação de dados de um Site pelos Mecanismos de Busca

Indexação

Durante o processo de Arquivamento da página (ou indexing) esse documento é preparado para uso por um sistema de IR. O site está todo cru para o sistema, cheio de tags, metatags, caracteres especiais, pontuações etc. Os sistemas precisam do conteúdo todo limpo para poder entender o que a sua página está falando. Então ele transforma o seu documento em uma representação de texto. Nesse processo ele cria duas bibliotecas: uma para expressões regulares e outra para stop words (palavras comuns, ex: que, de, etc.). Também seta alguns filtros e parsers (processadores).

Passos da Indexação

Linearização do Documento

É o processo onde o documento é reduzido somente a termos em minúsculo e sem pontuação. O sistema remove todas as tags HTML, toda a pontuação e acentuação, caracteres especiais e espaços.

O processo onde o texto é tratado após a remoção da marcação é conhecido como Tokenização.Na tokenização o computador é instruído a entender que aquela seqüência de bytes é uma palavra separada da outra. Alguns usam hífen, outros não.

Durante a linearização o CSS é removido. Logo, você percebe que se o seu HTML não estiver em ordem, o buscador vai ter em um primeiro momento uma informação desconexa e poderá entender errado o seu texto. Se você fez pirotecnia no css, mandando um texto que está em primeiro no HTML para o rodapé do site, já está no caminho errado. Por isso a importância do envolvimento de todas as áreas de desenvolvimento no trabalho de SEO.Se você tem um fluxo de informação coerente no seu HTML, na hora que o sistema de IR deixar “pelado” o seu site você estará tranqüilo, pois o carregamento da informação se dará de forma correta. Com os temas das informações sendo coerentes com tópicos e sub tópicos. O posicionamento do texto no seu carregamento na linearização se dá pela sua marcação HTML.

Quando há erros nesse fluxo o índice é avaliado erroneamente, alguns buscadores simplesmente ignoram os erros e você perde peso nessas determinadas áreas da sua página.

Filtragem

Neste processo o sistema faz a escolha dos termos que irão “representar” o seu documento, descrevendo o conteúdo e diferenciando a sua página das demais já arquivadas no banco de dados.

É nessa hora que as stop words são ignoradas da representação do texto, pois elas são palavras muito comuns presentes em milhares de textos, se elas fossem levadas em consideração a relevância seria afetada, porque elas não trazem a maior densidade de informação. Essa remoção se dá de forma padronizada, no começo da indexação o sistema cria uma biblioteca de termos muito usados e só os ignora nas representações posteriores como na Filtragem.

Deixando os talos

Aqui os termos irão ser reduzidos aos “talos”. O sistema detona as variações. Exemplo: as palavras “pensamos”, “pensais” e “pensam” vão virar somente “pensa”. Nem todos os sistemas usam o mesmo tipo de algoritmo para redução de termos.

Os mecanismos de busca fazem isso para economizar espaço, é uma maneira de reduzir o processamento e indexar mais páginas rapidamente. Existem várias complicações para esse processo que eu particularmente desconheço.E se você está se perguntando: e o que acontece com as variações? Lembre que é só uma representação do seu texto.

Pesos e Rankeamento

Esse é o último passo na maioria de sistemas IR da representação de texto da sua página, é onde os termos “talos” recebem pesos que podem ser atribuídos de diferentes formas, e é exatamente aqui que muitos analistas SEO e SEM começam a “chutação” com teorias mirabolantes como a de Keyword Density.

Quanto mais peso nos elementos on-page mais chances de posicionar o seu site em primeiro lugar nos buscadores, como o Google. Pois alguns fatores e elementos você não pode controlar, agora esses elementos é mais que seu dever como desenvolvedor fazer um bom trabalho.Nos próximos artigos aqui no iMasters vou abordar o que realmente sabemos sobre esses pesos e é nesse ponto que a coisa começa a ficar interessante para escrevermos textos competitivos e com grande densidade de peso nos elementos na página.

Referências:

Mi is lita

Information Retrieval

SEO Powered by Platinum SEO from Techblissonline