Cálculo rápido de padrões de dispersão usando algoritmos de funções hipergeométricas

Scientific Reports volume 13, Artigo número: 780 (2023) Citar este artigo

1588 acessos

3 Altmétrico

Detalhes das métricas

A dispersão de luz, raios X, elétrons ou nêutrons pela matéria é amplamente utilizada para caracterização estrutural em escalas de comprimento atômico a macroscópico. Com o advento de fontes de feixe de alto brilho e o rápido desenvolvimento de detectores pixelados de grandes áreas, os padrões de dispersão são agora adquiridos em taxas de quadros e tamanhos de quadros sem precedentes. A lenta análise desses padrões de dispersão evoluiu para um grave gargalo que retarda o conhecimento científico. Aqui apresentamos um algoritmo baseado no uso de funções hipergeométricas proporcionando ganhos em velocidade computacional de até 105 em comparação com os atuais algoritmos de integração numérica. Funções hipergeométricas fornecem descrições analíticas de formas geométricas, podem ser rapidamente computadas como expansões em série e assintóticas e podem ser implementadas com eficiência em GPUs. O algoritmo fornece a velocidade computacional necessária para calcular padrões de dispersão em escalas de tempo necessárias para feedback de experimentos em tempo real, análise de grandes volumes de dados de dispersão e para a geração de conjuntos de dados de treinamento para aprendizado de máquina.

O espalhamento de luz, raios X, elétrons ou nêutrons pela matéria é amplamente utilizado para caracterização de estruturas de materiais em escalas de comprimento atômico a macroscópico . Para obter informações estruturais em múltiplas escalas, é necessário que experimentos de espalhamento adquiram padrões de espalhamento em grandes áreas de detectores. Os detectores pixelados modernos, portanto, cobrem áreas cada vez maiores com números de pixels correspondentes agora superiores a 107. Concomitantemente, fontes de feixe de alta intensidade, como lasers, fontes síncrotron de quarta geração, fontes de espalação de nêutrons, microscópios eletrônicos com correção de aberração e fontes de raios X de jato de metal tornaram-se amplamente disponível. A combinação de feixes de alta intensidade com detectores rápidos de grandes áreas agora permite experimentos in situ e operando que elucidam mudanças estruturais rápidas e complexas, obtendo assim insights importantes sobre a evolução estrutural, função e desempenho dos materiais. Os materiais e dispositivos comumente investigados incluem ligas metálicas de alto desempenho, fibras, baterias, células de combustível e células solares, nanomateriais, compósitos, polímeros, colóides, membranas, bem como implantes, formulações de administração de medicamentos e tecidos biológicos.

Esta evolução levou a um aumento sem precedentes na taxa de aquisição e no volume de dados de dispersão 1D e 2D, de modo que o tempo necessário para a análise de dados se tornou um grande gargalo no processo de obtenção de informações sobre os materiais. Portanto, o software para redução e análise de dados de dispersão é continuamente aprimorado pela introdução de pipelines de análise de dados mais eficientes3, pela aceleração de GPU4 e pelo uso de algoritmos de aprendizado de máquina5. No entanto, a velocidade computacional para análise de dados não aumentou a uma taxa comparável ao aumento das atuais taxas de aquisição de dados.

A análise em escala multicomprimento de dados de dispersão de materiais geralmente prossegue pela modelagem de subestruturas com objetos geométricos, que são vinculados e montados em objetos compostos que são distribuídos espacialmente com um certo grau de ordem posicional e orientacional. Objetos geométricos comuns incluem esferas, elipsóides, paralelepípedos, cilindros, discos, poliedros ou tubos flexíveis ou membranas cujas superfícies podem ser descritas matematicamente em formas analíticas fechadas. Esta abordagem geométrica para modelar estruturas complexas também é comumente usada em simulações de computador e em algoritmos gráficos de rastreamento de raios.

O cálculo dos padrões de dispersão envolve o cálculo da transformada de Fourier da estrutura do objeto montado, e a subsequente média do tamanho, distribuições orientacionais e posicionais dos objetos que caracterizam o material real sob investigação . O cálculo requer várias integrações numéricas para calcular as transformadas de Fourier e calcular a média das funções de distribuição. Este cálculo é demorado e constitui o gargalo da etapa de análise de dados. Portanto, tem havido uma longa história de novos métodos matemáticos importantes para o cálculo e análise eficientes de funções de espalhamento .

105. The algorithm can be efficiently parallelized and implemented into GPUs for further acceleration. This enables the computation of 2D scattering patterns at > 1 fps even for current 4k pixel detectors./p>1\) (Regime II) we use the asymptotic expansion (Eq. (7)) for spheres (\(d=3\)) which is/p>

100-times faster compared to numerical integration. If we extrapolate the reported CPU time to 105 data points, the gain in computational speed is > 107./p> 1 fps calculation of 16 million data point 4k pixel detector scattering patterns with a single core CPUs as motivated in the Introductory Section./p> 50, enabling sub-second 1D- and 2D-fitting of very large detector array data as demonstrated in the Supporting Information (SI Sect. 12). As applications we demonstrate in the Supporting Information the simulation of large 2D small-angle X-ray (SAXS), small-angle neutron (SANS) and small-angle light scattering patterns, as well as selected area electron diffraction (SAED) patterns with 2k- or 4k-detectors (SI Sect. 12). We furthermore show GPU-accelerated 2D-fitting, and examples of simulated data sets for the training of neural networks./p> 105 faster than conventional numerical integration schemes. This acceleration is possible, because hypergeometric functions can be efficiently computed via series and asymptotic expansions, the expansion coefficients can be rapidly calculated via recursion relations and are q-independent. They are therefore the same for every pixel and can be pre-calculated and provided to the (i,j)-pixel calculation loop as described in the algorithm in Fig. 2. Over large q-ranges, only one or two terms of the expansion are necessary to compute the scattering intensities with sufficient accuracy. The algorithm enables the fast calculation of scattering patterns of simple and complex objects with defined spatial and orientational distributions. Since the computations of the pixel scattering intensities are mutually independent, the calculation can be efficiently implemented into parallel algorithms for GPUs for further significant acceleration. The algorithm enables rapid calculation of large area 2D-scattering patterns and 1D-scattering data enabling high-throughput fitting of large 1D- and 2D-data sets, on-the-fly data analysis for steering scattering experiments, and fast training of neural networks. It thereby helps addressing the data analysis bottleneck for widespread application in the structural analysis of synthetic and biological materials using X-ray, neutron, light and electron scattering and diffraction experiments. The significant saving in computation time of factors of 105–107 furthermore considerably reduces computer energy consumption relevant for green IT./p>