Mineração de dados

London Financial Studies

Descrição do Programa

Leia a descrição oficial

Mineração de dados

London Financial Studies

A popularidade das técnicas de ciência de dados, como mineração de dados e aprendizado de máquina, cresceu enormemente nos últimos anos. Eles apresentam soluções eficazes para processar e analisar a enorme quantidade de dados disponíveis para gerentes de risco e analistas financeiros.

Com os avanços no poder da computação e no processamento distribuído, agora é possível processar - e compreender - o vasto conjunto de informações que podem ser obtidas de várias fontes de dados diferentes.

Este programa prático cobre as principais técnicas - incluindo vários aspectos do aprendizado de máquina supervisionado e não supervisionado - que podem ser usadas na mineração de dados financeiros. O programa também se concentra em técnicas avançadas de ciência de dados que estão se tornando amplamente utilizadas nos mercados financeiros para análise de texto e inteligência artificial: Processamento de Linguagem Natural (PNL) e Aprendizado Profundo (DL).

O programa é entregue inteiramente através de workshops e estudos de caso. Os participantes aprenderão como implementar técnicas de processamento de linguagem natural criando um modelo de análise de sentimentos para analisar sequências de texto. Na seção de aprendizagem profunda, os participantes se concentrarão na construção e no teste de uma rede neural para resolver um problema financeiro com a ajuda do Python.

A maioria dos exercícios e estudos de caso é ilustrada em Python, permitindo que você aprenda a trabalhar com essa linguagem de programação flexível.

Data: 21 a 23 de novembro de 2018

Local: centro de Londres

Taxa: £ 1325 por dia

Você pode ser elegível para taxas preferenciais. Entre em contato conosco para verificar se sua empresa é membro do LFS Global Client Program.


Quem é o curso

  • Gestores de Portfólio
  • Gerentes de risco
  • Profissionais que procuram introduzir conceitos de mineração de dados em suas tarefas do dia-a-dia
  • Desenvolvedores de TI
  • Estatísticos
  • Analistas Quant
  • Engenheiros financeiros
  • Consultores


objetivos de aprendizado

  • Construir uma sólida base de conhecimento sobre técnicas e ferramentas de mineração de dados, bem como sua aplicação para o setor financeiro
  • Ganhe experiência prática em Processamento de Linguagem Natural e Aprendizagem Profunda em finanças
  • Aprenda como aplicar o Python à mineração e processamento de dados e resolver problemas reais de PNL e DL
  • Conhecer os algoritmos de Redes Neurais Artificiais (ANN) e como usá-los para projetar, construir e desenvolver modelos de DL


Conhecimento prévio

  • Noções básicas de estatística
  • Bom conhecimento de trabalho do Excel
  • Nenhum conhecimento prévio do Python é necessário


Esboço de Curso

Dia um

Visão geral da mineração de dados

Apresentando os diferentes componentes da mineração de dados

  • Regras de associação
  • Classificação versus problemas de regressão
  • Análise de Cluster

Visualização de dados

  • Visão geral de soluções de terceiros (Tableau, QlikeTech, etc.) para visualização de grandes conjuntos de dados. Os estudos de caso serão trabalhados usando a biblioteca matplotlib e plotly (plataforma de colaboração de dados on-line de código aberto)
  • Bases de dados gráficas: aplicação da teoria de redes à análise de portfólio e introdução a bases de dados gráficas
  • Detecção de outliers
  • Distância Mahalanobis

Regressão

  • OLS (mínimos quadrados ordinários)
  • Regressão Ridge
  • Esparsidade
  • Laço
  • Rede elástica

Workshop: Elaborando o hedge ideal de um grande portfólio de ações do mundo real usando futuros. O portfólio tem uma natureza global (100 compartilhamentos), mas apenas um conjunto limitado de futuros está disponível

Análise de componentes principais (PCA)

  • Análise de componentes principais da estrutura a termo das taxas de juros e volatilidades implícitas
  • Regressão de componentes principais (PCR)
  • Quadrados mínimos parciais (PLS)

Workshop: Usando o PCA para reduzir a dimensionalidade de um grande conjunto de dados de curvas históricas de taxa de juros. O comportamento complexo dessa curva está distribuído em diferentes vencimentos e essa técnica permite que um gerente de risco tenha uma visão muito melhor da dinâmica das curvas de taxas de juros.

Classificação de dados - regressão

Estimativa e Classificação da Densidade de Kernel

  • A estimativa da densidade do kernel é um procedimento de aprendizado não supervisionado, que leva a uma família simples de procedimentos para classificação não-paramétrica.

Estudo de caso: usando kernels para derivar distribuições de probabilidade para dados financeiros

Classificação - Parte I

  • Classificação Naive Bayes: Uma técnica direta e poderosa para classificar dados

Estudo de caso: elaborando um preditor de Bayes para um grande conjunto de dados contendo diferentes atributos dos bancos dos EUA. O classificador de Bayes será usado para separar os bancos que provavelmente falharão daqueles que permanecerão solventes.

Classificação - Parte II

  • Técnicas robustas de mineração de dados
  • Regressão Logística

Estudo de caso: aplicando log-regressão em um conjunto de dados do mundo real com alta dimensionalidade

Dia dois

Classificação de dados (cont.)

Classificação - Parte III

  • Árvores de classificação: a modelagem CART leva a árvores de decisão práticas fáceis de usar
  • O conceito de árvores de decisão será estendido com técnicas como Floresta Aleatória e Bagging

Estudo de caso: Conceitos como funções de custo, níveis de impureza, poda de árvores e validação cruzada serão tratados em detalhes

  • Aprendizado de K-Nearest Neighbor
  • Regressão Logística

Estudo de Caso: Os métodos de classificação (K-Nearest e CART) serão colocados em funcionamento em diferentes indicadores técnicos (RSI, MACD, etc.) de grandes conjuntos de dados financeiros do mundo real. Isso ilustrará como esses classificadores podem ser usados ​​para particionar estoques em diferentes buckets de acordo com a força de diferentes atributos de maneira rápida.

Workshop: Ferramentas de mineração de dados

Uma introdução ao Python - Uma poderosa linguagem de programação

A aplicabilidade do Python no domínio da análise de dados será ilustrada através de exemplos práticos com foco no aprendizado de máquina usando o pacote 'scikit-learn'. Todos os exemplos serão abordados nos cadernos da Jupyter. Os delegados aprenderão como criar relatórios personalizados em Python

Dia três

Processamento de linguagem natural

Extrair valor real de postagens de mídias sociais, imagens, e-mails, PDFs e outras fontes de dados não estruturados é um grande desafio para as empresas.

Esta seção é dedicada à aplicação do Processamento de Linguagem Natural (PNL) para extrair valor de dados não estruturados. Diversos exemplos do mundo real de análise de dados não estruturados em finanças - incluindo análise de sentimento de notícias financeiras - serão explorados.

Workshop: Usando o pacote NLTK do Python para:

  • Explore e tokenize um texto usando Tf-Idf e Count Vectors
  • Prever palavras em um texto: construindo um preditor de palavra a partir de um texto; escrevendo um programa que pode prever a palavra que segue uma determinada palavra
  • Entenda o sentimento de uma notícia sobre um determinado estoque

Aprendizagem profunda

Aprendizado Profundo como um subcampo de aprendizado de máquina - Algoritmos de Redes Neurais Artificiais (RNA).

  • Introdução ao Aprendizado Profundo
  • Propagação para frente
  • Abordagem Word2vec
  • Redes mais profundas e propagação direta
  • Otimizando a Rede Neural com Propagação Reversa

Estudo de caso: Criando um modelo de Aprendizado Detalhado com Python (com foco nos pacotes Keras e Tensorflow)

Esta escola oferece programas em:
  • Inglês


Última actualização August 9, 2018
Duração e Preço
Este curso é No campus
Start Date
Data inicial
Abril 10, 2019
Nov. 2019
Duration
Duração
3 dias
Tempo integral
Price
Preço
3,975 GBP
£ 1325 por dia
Information
Deadline
Locations
United Kingdom - London, England
Data inicial : Abril 10, 2019
Prazo de inscrição Contactar Escola
Data de conclusão Abril 12, 2019
Data inicial : Nov. 2019
Prazo de inscrição Contactar Escola
Data de conclusão Contactar Escola
Dates
Abril 10, 2019
United Kingdom - London, England
Prazo de inscrição Contactar Escola
Data de conclusão Abril 12, 2019
Nov. 2019
United Kingdom - London, England
Prazo de inscrição Contactar Escola
Data de conclusão Contactar Escola
Vídeos

LFS Webcast series - Applying Data-Mining in Finance