Mudanças entre as edições de "Orange"
Linha 23: | Linha 23: | ||
. Banco de dados PostgreSQL e MSSQL, por meio do complemento SQL. | . Banco de dados PostgreSQL e MSSQL, por meio do complemento SQL. | ||
− | Com estes arquivos é possível criar um fluxo de trabalho de análise de dados. A instalação padrão inclui vários algoritmos de aprendizado de máquina, pré-processamento e visualização de dados em seis conjuntos de complementos (dados, visualização, classificação, regressão, avaliação e não supervisionados). Assim é possível ler os dados, mostrar uma tabela de dados, selecionar recursos, comparar algoritmos de aprendizado, visualizar elementos de dados, etc. | + | Com estes arquivos é possível criar um fluxo de trabalho de análise de dados. A instalação padrão inclui vários algoritmos de aprendizado de máquina, pré-processamento e visualização de dados em seis conjuntos de complementos (dados, visualização, classificação, regressão, avaliação e não supervisionados). Assim é possível ler os dados, mostrar uma tabela de dados, selecionar recursos, comparar algoritmos de aprendizado, visualizar elementos de dados, etc. Um exemplo do fluxo de trabalho no Orange. |
+ | |||
+ | [[Arquivo:Orange_Fluxo.png|350px|thumb|right|Fluxo de Trabalho Orange]] |
Edição das 12h15min de 2 de julho de 2018
[Orange] é um programa que possibilita a mineração de dados de uma forma frutífera e divertida através de seu [software] de código aberto, <https://github.com/biolab/orange3>, que trabalha com aprendizado de máquina (machine learning) e visualização de dados (data visualization). Pode ser utilizado tanto por usuários iniciantes quanto especialistas. Seus fluxos de trabalho são baseados em análise de dados interativos atrelados a uma grande opção de ferramentas, incluindo uma variedade de técnicas de visualização, exploração, pré-processamento e modelagem de dados. Pode ser usado através de uma interface de usuário agradável e intuitiva ou, para usuários mais avançados, como um módulo para a linguagem de programação Python. Considerando que através da mineração de dados busca-se, entre outras relações, identificar padrões de similiridade ou de não conformidade nos conjuntos de dados, o Orange oferece diversos recursos de base estatística para o processamento dos dados.
Origem
O software é desenvolvido pelo [Laboratório de Bioinformática] dentro da Faculdade de Informação e Computação na Universidade de Ljubljana localizada na Eslovênia, e por ser de código aberto conta com a colaboração desta comunidade. Em 2018, a ferramenta completa seu vigésimo primeiro ano de história e este longo tempo é motivo de destaque, pois atesta a maturidade, segundo seus criadores, desta iniciativa dentro de um ambiente efêmero como o de desenvolvimento e lançamento de softwares.
Licença
Sobre o software é permitido sua redistribuição e/ou modificação sob os termos da [Licença Pública Geral GNU], publicada pela [Free Software Foundation]. A documentação, conteúdo do site, assim como outros conteúdos não relacionados aos códigos do software estão licenciados sob a forma de [Creative Commons Attribution-ShareAlike].
Instalação
Na [página] são disponibilizadas diferentes opções de instalação há versões para [Windows], [Linux] e [Mac]. É possível baixar um instalador com a última versão, neste caso, o Orange e o Miniconda serão instalados no seu computador, outra opção é realizar o download do Orange e Python ou ainda pode-se dentro do Python instalar o pacote Orange.
Características
O programa trabalha com arquivos nos formatos:
. Excel, arquivos delimitados por vírgulas e tabulações (.xlsx, .csv, .tab);
. Dados on-line no format do Google Planilhas;
. Imagens (.jpg, .tiff, .png) através do complemento ImageAnalytics;
. Arquivos de texto (.txt, .docx, .odt) com o complemento, Orange3-Corpus; e
. Banco de dados PostgreSQL e MSSQL, por meio do complemento SQL.
Com estes arquivos é possível criar um fluxo de trabalho de análise de dados. A instalação padrão inclui vários algoritmos de aprendizado de máquina, pré-processamento e visualização de dados em seis conjuntos de complementos (dados, visualização, classificação, regressão, avaliação e não supervisionados). Assim é possível ler os dados, mostrar uma tabela de dados, selecionar recursos, comparar algoritmos de aprendizado, visualizar elementos de dados, etc. Um exemplo do fluxo de trabalho no Orange.