Radialna funkcja bazowa

Radialna funkcja bazowa (ang. radial basis function – RBF) – funkcja rzeczywista, której wartość zależy zwykle wyłącznie od odległości od określonego punktu. Funkcje te są używane w funkcjach aproksymacji, dla ciągów prognoz czasowych i sterowania. W sztucznych sieciach neuronowych radialne funkcje bazowe są wykorzystywane jako funkcje aktywacji.

Każda funkcja ρ {\displaystyle \rho } która spełnia własność ρ ( x ) = ρ ( x ) {\displaystyle \rho (x)=\rho (\|x\|)} jest funkcją radialną. Za normę uznaje się zwykle metrykę euklidesową. Odległość może być mierzona od dowolnego punktu x k : {\displaystyle x_{k}{:}} ρ ( x , x k ) = ρ ( x x k ) . {\displaystyle \rho (x,x_{k})=\rho (\|x-x_{k}\|).} Punkt x k , {\displaystyle x_{k},} który zwykle jest znanym punktem aproksymacyjnym, nazywamy centrum.

Dwie nieznormalizowane radialne funkcje bazowe, z jednowymiarowym wejściem. Centra są zlokalizowane: x 1 = 0 , 75 ; x 2 = 3 , 25. {\displaystyle x_{1}=0{,}75;x_{2}=3{,}25.}

Metody aproksymacyjne

Wagowa kombinacja radialnych funkcji bazowych

y ( x ) = k = 1 K w k ρ ( x x k ) {\displaystyle y(\mathbf {x} )=\sum _{k=1}^{K}w_{k}\rho (\|\mathbf {x} -\mathbf {x} _{k}\|)}

może być użyta do aproksymacji dowolnych funkcji ciągłych z bezwzględną dokładnością dla punktów gęsto położonych. Taka suma może być rozumiana jako typ sztucznych sieci neuronowych, zwanych sieciami radialnych funkcji bazowych. Aproksymacja jest zmienna, co pozwala na „uczenie” współczynników wagowych w k {\displaystyle w_{k}} stanowiących rozwiązanie układu K {\displaystyle K} (liczba wszystkich punktów aproksymacyjnych) równań spełniających warunek:

y k = l = 1 K w l ρ l k , {\displaystyle y_{k}=\sum _{l=1}^{K}w_{l}\rho _{lk},}

gdzie y ( x k ) = y k {\displaystyle y(\mathbf {x} _{k})=y_{k}} oznacza znane wartości aproksymacyjne w znanych punktach aproksymacyjnych x k , {\displaystyle x_{k},} ρ l k = ρ ( x l x k ) , {\displaystyle \rho _{lk}=\rho (\|\mathbf {x} _{l}-\mathbf {x} _{k}\|),} a l = 1 , 2 , , K . {\displaystyle l=1,2,\dots ,K.}

Macierz powyższego układu ma postać:

[ y 1 y K ] = [ ρ 11 ρ K K ] [ w 1 w K ] {\displaystyle {\begin{bmatrix}y_{1}\\\dots \\y_{K}\end{bmatrix}}={\begin{bmatrix}\rho _{11}&\dots &\dots \\\dots &\dots &\dots \\\dots &\dots &\rho _{KK}\end{bmatrix}}{\begin{bmatrix}w_{1}\\\dots \\w_{K}\end{bmatrix}}}

i jest symetryczna (co wynika z własności funkcji bazowych i drugiego aksjomatu metryki), a poprzez odpowiedni dobór funkcji bazowych, również dodatnio określona[1]. Metoda funkcji radialnych jest nowoczesną metodą aproksymacyjną. Jej wadą jest jednak konieczność wyznaczenia wektora K {\displaystyle K} współczynników aproksymacyjnych w k , {\displaystyle w_{k},} co dla dużych zbiorów danych może być bardzo czasochłonne.

Przykłady radialnych funkcji bazowych

Zwykle stosuje się następujące typy radialnych funkcji bazowych:

  1. liniową: ρ ( r ) = r , {\displaystyle \rho (r)=r,}
  2. sześcienną: ρ ( r ) = r 3 , {\displaystyle \rho (r)=r^{3},}
  3. cienkiej płytki: (ang. thin-plate spline)[2]: ρ ( r ) = r 2 log ( r ) , {\displaystyle \rho (r)=r^{2}\log(r),}
  4. gaussowską: (ang. gaussian): ρ ( r ) = exp ( β r 2 ) , {\displaystyle \rho (r)=\exp(-\beta r^{2}),}
  5. wielokwadratową (ang. multiquadratic): ρ ( r ) = r 2 + β 2 , {\displaystyle \rho (r)={\sqrt {r^{2}+\beta ^{2}}},}
  6. odwrotną wielokwadratową (ang. inverse multiquadratic): ρ ( r ) = ( r 2 + β 2 ) 1 / 2 , {\displaystyle \rho (r)=\left(r^{2}+\beta ^{2}\right)^{-1/2},}
  7. wielomianową (ang. polynomial): ρ ( r ) = r 2 + β 2 , {\displaystyle \rho (r)=r^{2}+\beta ^{2},}
  8. funkcję Wendlanda[3]: ρ ( r ) = { ( 1 r R ) 4 ( 4 r R + 1 ) r R < 1 0 r R 1 , {\displaystyle \rho (r)={\begin{cases}\left(1-{\frac {r}{R}}\right)^{4}\left(4{\frac {r}{R}}+1\right)&{\frac {r}{R}}<1\\0&{\frac {r}{R}}\geqslant 1\end{cases}},}
  9. funkcję Wu[4]: ρ ( r ) = { ( 1 r R ) 4 ( 4 + 16 r R + 12 ( r R ) 2 + 3 ( r R ) 3 ) r R < 1 0 r R 1 . {\displaystyle \rho (r)={\begin{cases}\left(1-{\frac {r}{R}}\right)^{4}\left(4+16{\frac {r}{R}}+12\left({\frac {r}{R}}\right)^{2}+3\left({\frac {r}{R}}\right)^{3}\right)&{\frac {r}{R}}<1\\0&{\frac {r}{R}}\geqslant 1\end{cases}}.}

Cechą wspólną funkcji bazowych 4–7 jest zastosowanie parametru rozmycia β > 0 , {\displaystyle \beta >0,} pozwalającego na uniknięcie osobliwości lub złego uwarunkowania macierzy układu[5] wynikających między innymi z zerowania się odległości ( r ) {\displaystyle (r)} dla nakładających się lub bliskich sobie punktów aproksymacyjnych x k . {\displaystyle x_{k}.} Właściwy dobór parametru β {\displaystyle \beta } może być jednak problematyczny i zwykle stosuje się tu jakieś dodatkowe kryterium, zależne od właściwości fizycznych analizowanego problemu. Jedną ze znanych propozycji jest kryterium związane z błędem pomiaru odległości[6] punktów aproksymacyjnych. Inną możliwością jest zastosowanie metryki pomiarowej.

Inną możliwością jest określenie minimalnej dopuszczalnej odległości pomiędzy punktami aproksymacyjnymi (ang. data separation), bądź też zastosowanie funkcji bazowych o zwartym nośniku (ang. compact support) 8 lub 9 jakim jest obszar wokół punktu 0 i promieniu R , {\displaystyle R,} jaki w tym przypadku stanowi parametr kontrolny.

Dodatkowo, dzięki zastosowaniu funkcji o zwartym nośniku typu macierz układu równań, z rozwiązania, którego określane są współczynniki w k {\displaystyle w_{k}} jest nie tylko symetryczna i dodatnio określona, ale również rzadka, co pozwala na zastosowanie szybkich algorytmów iteracyjnych. Ponadto reprezentacja funkcji aproksymacyjnej ma wtedy charakter lokalny, przez co złożoność obliczeniowa samego procesu aproksymacji jest znacznie mniejsza[5].

Przypisy

  1. Buhmann M. D., Multivariate interpolation using radial basis functions, Ph. D. Thesis, University of Cambridge, England, 1989.
  2. Duchon J., Splines minimizing rotation-invariant semi-norms in Sobolev spaces, Multivariate Approximation Theory, Birkhauser, 1977.
  3. Wendland H., Piecewise polynomial, positive definite and compactly supported radial functions of minimal degree, Advances in Comp. Mathematics, 4, 1995.
  4. Wu Z., Multivariate compactly supported positive definite radial functions, Advances in Computational Mathematics, 4(3), 1996.
  5. a b Hjelle Ø., Explicit Surfaces in Siscat, The Siscat Report Series SINTEF, Oslo, March 1996.
  6. Karmowski W., Wspomagana teorią interpretacja wyników eksperymentów mechaniki ciał odkształcalnych, Politechnika Krakowska, monografia 251, Kraków, 1999.