Quanto Canto

O Quanto Canto é o primeiro e único sistema para aparelhos de karaokê no mundo que avalia o canto do usuário tomando três parâmetros para medição da performance, ritmo, afinação e potência da voz. A maioria dos sistemas de avaliação do canto, disponível no mercado, tem como parâmetro somente a potência de voz do usuário. Para atribuir a nota ao usuário, o Quanto Canto compara a voz do cantor com a voz da música original, por meio da ponderação dos três parâmetros: ritmo, afinação e potência de voz. Outra vantagem do sistema é poder ser instalado em qualquer equipamento que tenha a função Karaokê. O produto estará disponível no mercado em novembro. Em três anos de trabalho o Genius Instituto de Tecnologia do Amazonas submeteu ao INPI três pedidos de patentes e dois registros de computador, além de um pedido de patente nos Estados Unidos e um ao Japão. Os produtos são: um dispositivo e método de avaliação de desempenho de canto; sistema eletrônico para extração não assistida de objetos em imagens dinâmicas com função não homogênea em tempo real e método e dispositivo de segurança acionado por sons. Por ser um centro tecnológico o Genius não possui cardápio fixo de produtos para o consumidor final mas sim um conjunto de tecnologias e plataformas inovadoras que são transferidas ou licenciadas para empresas nacionais e internacionais para comercialização. O Genius ganhou o segundo lugar na categoria Instituição de Pesquisa da região Norte do Prêmio Finep 2004. O sistema Quanto Canto recebeu o Prêmio Finep 2002 categoria Produto, região Norte.


O sistema foi desenvolvido entre 2001 e 2002 no Genius Instituto de Tecnologia, em Manaus. Esta invenção foi licenciada para a empresa Gradiente Eletrônica, e envolveu o uso da capacidade de processamento ociosa do aparelho de DVD para implementar um método de avaliação mais eficiente que os demais disponíveis no mercado, por avaliar não apenas o volume do canto, mas também o ritmo e a afinação, através da comparação com a voz original, fornecendo ainda uma realimentação visual em tempo real da performance do cantor, permitindo que ele se corrija. O fato de usar a capacidade ociosa permitiu que uma nova funcionalidade pudesse ser adicionada a um produto em processo de comoditização, como um importante diferencial competitivo, permitindo a cobrança de um preço premium, mas sem custos adicionais (já que utiliza elementos já disponíveis no aparelho). Desta forma, foi possível para a Gradiente combater o forte processo de comoditização dos aparelhos de DVD Player promovido pela importação de aparelhos asiáticos.

Outra invenção de Thomas Strasser, na qual outros oito colegas tiveram fundamental participação é o sistema de controle remoto por voz independente do locutor, para o Português falado no Brasil. Este invento está em fase de inserção no mercado, e tem um grande potencial de auxílio a portadores de deficiência, permitindo o comando e o acionamento de funções nos mais variados aparelhos eletroeletrônicos, através da fala. O fato de ser independente do locutor implica na ausência de necessidade de treinamento do sistema, permitindo que qualquer pessoa, independentemente do seu sexo, idade, origem e sotaque possa usar o sistema de forma simples e intuitiva. O sistema foi desenvolvido de forma a cobrir todas as variantes da língua falada no Brasil, permitindo um desempenho melhor que o de sistemas adaptados à nossa língua a partir do Inglês.

O sistema de avaliação de desempenho de canto surgiu de uma solicitação da Gradiente de se desenvolver um diferencial competitivo para um produto em rápido processo de comoditização. O fato dos sistemas de avaliação disponíveis no mercado até então (e que continuam assim até hoje) serem muito imprecisos e causarem insatisfação nos usuários motivou o estudo de uma solução alternativa. Neste estudo, identificou-se que estes sistemas utilizavam unicamente o volume da voz do usuário como parâmetro de avaliação (dando uma nota mais alta para o usuário que cantasse mais alto). Desta forma, iniciou-se uma pesquisa de teoria musical, que determinou os principais componentes do canto: a melodia, a harmonia e o ritmo. Destes, a melodia e o ritmo, por serem mais simples e objetivos, foram escolhidos para servirem de base de avaliação. Foram então estudados métodos de medição e quantização destes parâmetros, e desenvolveu-se um protótipo do sistema. Este protótipo, apesar de não rodar em tempo real (a avaliação de uma música de alguns minutos demorava horas), demonstrou a viabilidade da proposta.

A partir deste ponto, diversas técnicas de processamento digital de sinais foram necessárias para otimizar os algoritmos envolvidos no sistema, permitindo que ele rodasse em tempo real e consumisse um poder computacional suficientemente reduzido para permitir a sua implementação utilizando o processamento ocioso disponível no aparelho de karaokê. Neste trabalho, desenvolveu-se uma característica interessante de modularidade e escalabilidade do sistema, permitindo que diferentes níveis de precisão fossem alcançados em função do poder computacional disponível. Finalmente, foi feito o porte deste sistema para o processador específico do aparelho, o que exigiu um grande esforço de integração com o fabricante do processador. Eu participei ativamente na concepção do sistema, na identificação e medição dos parâmetros e na otimização dos algoritmos de medição e comparação.

O sistema de controle remoto por voz foi motivado por uma prospecção de cenários tecnológicos para a evolução das interfaces entre homens e máquinas. Como resultado desta prospecção, identificou-se a área de reconhecimento automático da fala como uma área de grande potencial. A partir de então, desenvolveu-se uma primeira prova de conceito, através do desenvolvimento de um controle remoto de aparelhos de eletrônica de consumo acionado por voz, baseado na tecnologia de reconhecimento de palavras isoladas. Com o sucesso da prova de conceito, que envolveu, na época, a participação de três pesquisadores, decidiu-se estruturar uma área de desenvolvimento da tecnologia de reconhecimento automático da fala. Foram contratados pesquisadores experientes na área vindos de empresas estrangeiras atuantes no setor, que lideraram a estruturação da equipe, que chegou a contar com cerca de 30 pesquisadores. Nesta nova etapa, as técnicas mais avançadas de reconhecimento automático da fala contínua, independente do locutor, e com diversas funcionalidades de otimização do desempenho desenvolvidas internamente no Instituto, permitiram o desenvolvimento de um sistema genuinamente nacional e competitivo com os demais sistemas existentes no mundo. Neste desenvolvimento, a minha participação se deu na prospecção inicial, no desenvolvimento da prova de conceito e no desenvolvimento de diversos módulos do sistema, como o modelo acústico, o compilador de gramática, a detecção de atividade de voz, a rejeição de palavras fora do vocabulário e o algoritmo de busca de hipóteses.

O DVDokê da Gradiente foi introduzido no Mercado no segundo semestre de 2001. Até hoje, as receitas da Gradiente vindas exclusivamente do DVDokê somam mais de R$ 100 milhões e, apenas de 2004 até hoje (os valores de 2001 a 2003 eu não consegui levantar a tempo para incluir nesta resposta!), os retornos obtidos pelo Genius Instituto de Tecnologia através de royalties somam R$ 1,5 milhões. O sistema de controle remoto por reconhecimento de fala foi colocado no mercado através de licenciamento de software. Algumas empresas integradoras de sistemas já assinaram contratos de licenciamento e estão desenvolvendo seus produtos, que devem chegar ao mercado a partir de 2007.

No caso do sistema de avaliação de desempenho de canto, a principal dificuldade foi o convencimento de que a solução era tecnicamente viável e a consequente negociação da abertura do sistema de DVD dos fornecedores de tecnologia da Gradiente, para possibilitar o porte do sistema desenvolvido pelo Genius. Esta dificuldade foi superada enviando-se os pesquisadores do Genius para implementar este porte no escritório de P&D da empresa, na Califórnia, EUA. No que concerne o sistema de controle remoto por voz, a principal dificuldade foi garantir a funcionalidade do sistema considerando a independência do locutor e os diferentes sotaques falados no Brasil. Para superar esta dificuldade, foi necessário desenvolver um sistema de mapeamento linguístico do Português falado no Brasil, modelar uma base de dados que garantisse a cobertura fonética adequada deste mapeamento, desenvolver um sistema para automatização da tarefa de coleta de vozes, e coletar dezenas de milhares de horas de gravação de voz em todo o Brasil.

O desenvolvimento do sistema de avaliação de desempenho de canto contou com a consultoria de professores do Laboratório de Processamento de Sinais da COPPE, Universidade Federal do Rio de Janeiro. O desenvolvimento do sistema de controle remoto por voz contou com a consultoria de um professor do Laboratório de Processamento de Sinais da COPPE, Universidade Federal do Rio de Janeiro, na etapa preliminar de desenvolvimento do sistema e, posteriormente, com a participação, através de consultoria, de professores da Pontifícia Universidade Católica do Rio Grande do Sul, da Universidade Federal do Rio Grande do Sul, e de alunos da Universidade Estadual de Campinas.

O Genius Instituto de Tecnologia foi criado em novembro de 1999, pela iniciativa privada, para dedicar-se a pesquisa e ao desenvolvimento com foco em inovações tecnológicas nas áreas de eletroeletrônica, microeletrônica, software e software embarcado. Seu principal cliente é a empresa brasileira Gradiente Eletrônica S/A. O Ministério da Ciência e Tecnologia é parceiro do Genius na elaboração e execução do Programa Nacional de Microeletrônica. A maior característica do instituto é atuar em projetos e plataformas tecnológicas, suprindo as necessidades de seus clientes e parceiros. Tudo isso, sem fins lucrativos. O maior patrimônio do Genius é a sua equipe altamente qualificada. São cerca de 150 colaboradores, dos quais aproximadamente 10% são doutores e 50% mestres ou mestrandos, vindos de vários estados brasileiros e de outros países, de empresas nacionais e multinacionais. A parceria entre o Genius e a Universidade Federal do Amazonas, UFAM, criou o primeiro, e ainda único, Mestrado em Informática da região Norte do País. A primeira turma iniciou o curso em agosto de 2001, e atualmente o curso já se encontra na quarta turma. Este curso, antes mesmo da formação da primeira turma, recebeu o credenciamento oficial da CAPES, e é uma contribuição do Genius à sociedade manauense.

 

 

Fonte:

http://www.finep.gov.br/premio/folhas_inovacao_premio_2004/norte_tela.pdf

http://www.genius.org.br/

http://www.genius.org.br/observatorio_noticias_finep_set2002.htm

acesso em julho de 2005

Agradeço ao INPI/FINEP pelo envio de informações em junho de 2008 para composição desta página

Posso ajudar?