Minicursos V EPBEST
MINICURSO 1 (MC1): Introdução a análise estatística espacial, da visualização com mapas até modelagem usando R.
Autor: Elisangela Lizzi (UTFPR- DAMAT/ PPGBIOINFO)
Resumo: A análise estatística espacial é uma poderosa ferramenta para compreender e interpretar informações geográficas, desempenhando um papel fundamental na identificação de padrões, tendências e relações espaciais em diversas áreas do conhecimento, como saúde pública, ciências sociais, meio ambiente e agricultura. Ao transformar dados em mapas e traduzir achados usando modelagem estatística espacial, é possível oferecer suporte a tomadas de decisão baseadas em evidências e propor estratégias mais eficazes de intervenção regionais no território de interesse. Este minicurso propõe uma introdução prática e acessível ao uso da linguagem de programação R para a análise e visualização de dados espaciais. Serão abordados conceitos básicos de estatística espacial, criação de mapas e modelos estatísticos espaciais, conectando teoria e prática em um fluxo de análise que aborda desde a visualização até os achados usando modelagem, de forma robusta e atrativa. Voltado para estudantes de graduação e pós-graduação, bem como pesquisadores interessados em explorar o universo da estatística espacial aplicada, este minicurso fornecerá as bases para o desenvolvimento de estudos espaciais, incentivando uma compreensão crítica e prática do uso de dados geográficos. Independentemente da área de atuação, os participantes sairão preparados para iniciar análises espaciais e contribuir de forma especifica para suas áreas de pesquisa ou prática profissional.

Elisangela Lizzi
UTFPR
Elisangela Lizzi
TÍTULO: Introdução a análise estatística espacial, da visualização com mapas até modelagem usando R.
RESUMO: A análise estatística espacial é uma poderosa ferramenta para compreender e interpretar informações geográficas, desempenhando um papel fundamental na identificação de padrões, tendências e relações espaciais em diversas áreas do conhecimento, como saúde pública, ciências sociais, meio ambiente e agricultura. Ao transformar dados em mapas e traduzir achados usando modelagem estatística espacial, é possível oferecer suporte a tomadas de decisão baseadas em evidências e propor estratégias mais eficazes de intervenção regionais no território de interesse. Este minicurso propõe uma introdução prática e acessível ao uso da linguagem de programação R para a análise e visualização de dados espaciais. Serão abordados conceitos básicos de estatística espacial, criação de mapas e modelos estatísticos espaciais, conectando teoria e prática em um fluxo de análise que aborda desde a visualização até os achados usando modelagem, de forma robusta e atrativa. Voltado para estudantes de graduação e pós-graduação, bem como pesquisadores interessados em explorar o universo da estatística espacial aplicada, este minicurso fornecerá as bases para o desenvolvimento de estudos espaciais, incentivando uma compreensão crítica e prática do uso de dados geográficos. Independentemente da área de atuação, os participantes sairão preparados para iniciar análises espaciais e contribuir de forma especifica para suas áreas de pesquisa ou prática profissional.
MINI CURRÍCULO: Bacharel em Estatística pela Universidade Federal de São Carlos (UFSCar-2010), com Mestrado (2012) e Doutorado (2015) em Saúde Pública na Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (USP). Neste momento, é professora adjunta e pesquisadora da Universidade Tecnológica Federal do Paraná, campus Cornélio Procópio. É mãe de um filho nascido em 2008 e atuante na causa de mulheres na ciência. Atua como Editora Associada dos Cadernos de Saúde Pública. É Professora Credenciada no Programa de Pós Graduação em Bioinformática da UTFPR-CP. Consultora Técnica do Ministério da Saúde no Programa de Fortalecimento de Epidemiologia nos Serviços de Saúde (PROFEPI) em cursos de formação especializada. Cientista de dados de saúde e estatística, com ênfase e experiência em estatística aplicada e bioestatística, principalmente nos seguintes temas: estatística aplicada em saúde pública/vigilância em saúde/ epidemiologia, modelos de regressão, análise de séries temporais, métodos quantitativos em saúde, padrões de espaço temporal, classificação automática, aprendizado de máquina, estatística espacial e inferência bayesiana.
MINICURSO 2 (MC2): Explorando R e Python com Spark no contexto da Estatística
Autor: Jodavid Ferreira (UFPE)
Resumo: Linguagens de programação como R e Python estão dominando atualmente o desenvolvimento de soluções para análise de dados. Entretanto, nos últimos anos, surgiu a necessidade de ferramentas capazes de lidar com grandes volumes de dados, reforçando a importância de tecnologias adequadas para esse contexto. Nesse cenário, o Spark se destaca como um framework amplamente utilizado, permitindo o processamento distribuído de dados em larga escala. Integrar R e Python ao ambiente de processamento distribuído oferecido pelo Spark representa uma oportunidade enriquecedora, viabilizando o processamento escalável e eficiente de grandes volumes de dados, ao mesmo tempo em que aproveita o conhecimento consolidado dessas linguagens. Essa abordagem combinada capacita estudantes e profissionais a aplicar conceitos estatísticos, utilizando uma poderosa integração do Spark com as linguagens, especialmente necessária para lidar com grandes volumes de dados, permitindo, assim, o uso de métodos existentes e o desenvolvimento de novas soluções. Serão apresentadas algumas soluções existentes com a utilização dessas tecnologias, e, como solução do minicurso, vamos desenvolver uma aplicação prática resolvendo a seguinte problemática: com base no histórico de compras de clientes, qual seria a melhor recomendação para a próxima compra?

Jodavid Ferreira
UFPE
Jodavid de Araujo Ferreira
TÍTULO: Explorando R e Python com Spark no contexto da Estatística:
RESUMO: Linguagens de programação como R e Python estão dominando atualmente o desenvolvimento de soluções para análise de dados. Entretanto, nos últimos anos, surgiu a necessidade de ferramentas capazes de lidar com grandes volumes de dados, reforçando a importância de tecnologias adequadas para esse contexto. Nesse cenário, o Spark se destaca como um framework amplamente utilizado, permitindo o processamento distribuído de dados em larga escala. Integrar R e Python ao ambiente de processamento distribuído oferecido pelo Spark representa uma oportunidade enriquecedora, viabilizando o processamento escalável e eficiente de grandes volumes de dados, ao mesmo tempo em que aproveita o conhecimento consolidado dessas linguagens. Essa abordagem combinada capacita estudantes e profissionais a aplicar conceitos estatísticos, utilizando uma poderosa integração do Spark com as linguagens, especialmente necessária para lidar com grandes volumes de dados, permitindo, assim, o uso de métodos existentes e o desenvolvimento de novas soluções. Serão apresentadas algumas soluções existentes com a utilização dessas tecnologias, e, como solução do minicurso, vamos desenvolver uma aplicação prática resolvendo a seguinte problemática: com base no histórico de compras de clientes, qual seria a melhor recomendação para a próxima compra?
MINI CURRÍCULO: Atualmente é professor do Departamento de Estatística da Universidade Federal de Pernambuco (UFPE) e do Programa de Pós-Graduação em Estatística da UFPE (PPGEST). Realizou um Pós-Doutorado no Programa de Pós-Graduação em Modelos de Decisão e Saúde na UFPB (2021-2024). Possui doutorado em em Estatística pela UFPE (2021), mestrado em Estatística pela UFPE (2017) e graduação em Estatística pela UFPB (2015). É entusiasta de software livre e de código aberto (free and open-source software – FOSS) e procura estar sempre atualizado em avanços tecnológicos e temas relacionados à Inteligência Artificial. Desenvolve pesquisas em áreas da estatística como Ciência de Dados, Aprendizagem Estatística de Máquina, Aprendizagem Profunda, Estatística Computacional, Aprendizado Supervisionado (classificação), Aprendizado Não Supervisionado (segmentação, clusterização), distribuições de Probabilidade, Probabilidade Fuzzy, testes de hipótese, inferência estatística, teoria da informação e IA Generativa aplicados a dados estruturados e não estruturados como processamento de imagens e áudio.