<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD Journal Publishing DTD v2.3 20070202//EN" "journalpublishing.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" article-type="research-article">
<front>
<journal-meta>
<journal-id journal-id-type="publisher-id">Front. Appl. Math. Stat.</journal-id>
<journal-title>Frontiers in Applied Mathematics and Statistics</journal-title>
<abbrev-journal-title abbrev-type="pubmed">Front. Appl. Math. Stat.</abbrev-journal-title>
<issn pub-type="epub">2297-4687</issn>
<publisher>
<publisher-name>Frontiers Media S.A.</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.3389/fams.2017.00023</article-id>
<article-categories>
<subj-group subj-group-type="heading">
<subject>Applied Mathematics and Statistics</subject>
<subj-group>
<subject>Original Research</subject>
</subj-group>
</subj-group>
</article-categories>
<title-group>
<article-title>Regularized Kernel Algorithms for Support Estimation</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name><surname>Rudi</surname> <given-names>Alessandro</given-names></name>
<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
<xref ref-type="aff" rid="aff2"><sup>2</sup></xref>
<uri xlink:href="http://loop.frontiersin.org/people/455721/overview"/>
</contrib>
<contrib contrib-type="author" corresp="yes">
<name><surname>De Vito</surname> <given-names>Ernesto</given-names></name>
<xref ref-type="aff" rid="aff3"><sup>3</sup></xref>
<xref ref-type="author-notes" rid="fn001"><sup>&#x0002A;</sup></xref>
<uri xlink:href="http://loop.frontiersin.org/people/380237/overview"/>
</contrib>
<contrib contrib-type="author">
<name><surname>Verri</surname> <given-names>Alessandro</given-names></name>
<xref ref-type="aff" rid="aff4"><sup>4</sup></xref>
</contrib>
<contrib contrib-type="author">
<name><surname>Odone</surname> <given-names>Francesca</given-names></name>
<xref ref-type="aff" rid="aff4"><sup>4</sup></xref>
<uri xlink:href="http://loop.frontiersin.org/people/158199/overview"/>
</contrib>
</contrib-group>
<aff id="aff1"><sup>1</sup><institution>INRIA&#x02014;Sierra team&#x02014;&#x000C9;cole Normale Sup&#x000E9;rieure</institution>, <addr-line>Paris</addr-line>, <country>France</country></aff>
<aff id="aff2"><sup>2</sup><institution>Laboratory for Computational and Statistical Learning, Istituto Italiano di Tecnologia</institution>, <addr-line>Genova</addr-line>, <country>Italy</country></aff>
<aff id="aff3"><sup>3</sup><institution>Dipartimento di Matematica, Universit&#x000E0; di Genova</institution>, <addr-line>Genova</addr-line>, <country>Italy</country></aff>
<aff id="aff4"><sup>4</sup><institution>DIBRIS, Universit&#x000E0; di Genova</institution>, <addr-line>Genova</addr-line>, <country>Italy</country></aff>
<author-notes>
<fn fn-type="edited-by"><p>Edited by: Ding-Xuan Zhou, City University of Hong Kong, Hong Kong</p></fn>
<fn fn-type="edited-by"><p>Reviewed by: Ting Hu, Wuhan University, China; Sergiy Pereverzyev, University of Innsbruck, Austria; Qiang Wu, Middle Tennessee State University, United States</p></fn>
<fn fn-type="corresp" id="fn001"><p>&#x0002A;Correspondence: Ernesto De Vito <email>devito&#x00040;dima.unige.it</email></p></fn>
<fn fn-type="other" id="fn002"><p>This article was submitted to Mathematics of Computation and Data Science, a section of the journal Frontiers in Applied Mathematics and Statistics</p></fn></author-notes>
<pub-date pub-type="epub">
<day>08</day>
<month>11</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="collection">
<year>2017</year>
</pub-date>
<volume>3</volume>
<elocation-id>23</elocation-id>
<history>
<date date-type="received">
<day>11</day>
<month>08</month>
<year>2017</year>
</date>
<date date-type="accepted">
<day>25</day>
<month>10</month>
<year>2017</year>
</date>
</history>
<permissions>
<copyright-statement>Copyright &#x000A9; 2017 Rudi, De Vito, Verri and Odone.</copyright-statement>
<copyright-year>2017</copyright-year>
<copyright-holder>Rudi, De Vito, Verri and Odone</copyright-holder>
<license xlink:href="http://creativecommons.org/licenses/by/4.0/"><p>This is an open-access article distributed under the terms of the Creative Commons Attribution License (CC BY). The use, distribution or reproduction in other forums is permitted, provided the original author(s) or licensor are credited and that the original publication in this journal is cited, in accordance with accepted academic practice. No use, distribution or reproduction is permitted which does not comply with these terms.</p></license>
</permissions>
<abstract><p>In the framework of non-parametric support estimation, we study the statistical properties of a set estimator defined by means of Kernel Principal Component Analysis. Under a suitable assumption on the kernel, we prove that the algorithm is strongly consistent with respect to the Hausdorff distance. We also extend the above analysis to a larger class of set estimators defined in terms of a low-pass filter function. We finally provide numerical simulations on synthetic data to highlight the role of the hyper parameters, which affect the algorithm.</p></abstract>
<kwd-group>
<kwd>support estimation</kwd>
<kwd>Kernel PCA</kwd>
<kwd>novelty detection</kwd>
<kwd>dimensionality reduction</kwd>
<kwd>regularized Kernel methods</kwd>
</kwd-group>
<counts>
<fig-count count="7"/>
<table-count count="1"/>
<equation-count count="92"/>
<ref-count count="47"/>
<page-count count="15"/>
<word-count count="8112"/>
</counts>
</article-meta>
</front>
<body>
<sec sec-type="intro" id="s1">
<title>1. Introduction</title>
<p>A classical issue in statistics is support estimation, i.e., the problem of learning the support of a probability distribution from a set of points identically sampled according to the distribution. For example, the Devroye-Wise algorithm [<xref ref-type="bibr" rid="B1">1</xref>] estimates the support with the union of suitable balls centered in the training points. In the last two decades, many algorithms have been proposed and their statistical properties analyzed [<xref ref-type="bibr" rid="B1">1</xref>&#x02013;<xref ref-type="bibr" rid="B14">14</xref>] and references therein.</p>
<p>An instance of the above setting, which plays an important role in applications, is the problem of novelty/anomaly detection, see Campos et al. [<xref ref-type="bibr" rid="B15">15</xref>] for an updated review. In this context, in Hoffmann [<xref ref-type="bibr" rid="B16">16</xref>] the author proposed an estimator based on Kernel Principal Component Analysis (KPCA), first introduced in Sch&#x000F6;lkopf et al. [<xref ref-type="bibr" rid="B17">17</xref>] in the context of dimensionality reduction. The algorithm was successfully tested in many applications from computer vision to biochemistry [<xref ref-type="bibr" rid="B18">18</xref>&#x02013;<xref ref-type="bibr" rid="B24">24</xref>]. In many of these examples the data are often represented by high dimensional vectors, but they actually live close to a nonlinear low dimensional submanifold of the original space, and the proposed estimator takes advantage of the fact that KPCA provides an efficient compression/dimensionality reduction of the original data [<xref ref-type="bibr" rid="B16">16</xref>, <xref ref-type="bibr" rid="B17">17</xref>], whereas many classical set estimators refer to the dimension of the original space, as it happens for the Devroye-Wise algorithm.</p>
<p>In this paper we prove that KPCA is a consistent estimator of the support of the distribution with respect to the Hausdorff distance. The result is based on an intriguing property of the reproducing kernel, called <italic>separating condition</italic>, first introduced in De Vito et al. [<xref ref-type="bibr" rid="B25">25</xref>]. This assumption ensures that any closed subset of the original space is represented in the feature space by a linear subspace. We show that this property remains true if the data are recentered to have zero mean in the feature space. Together with the results in De Vito et al. [<xref ref-type="bibr" rid="B25">25</xref>], we conclude that the consistency of KPCA algorithm is preserved by recentering of the data, which can be regarded as a degree of freedom to improve the empirical performance of the algorithm in a specific application.</p>
<p>Our main contribution is sketched in the next subsection together with some basic properties of KPCA and some relevant previous works. In section 2, we describe the mathematical framework and the related notations. Section 3 introduces the spectral support estimator and informally discusses its main features, whereas its statistical properties and the meaning of the <italic>separating condition</italic> for the kernel are analyzed in section 4. Finally section 5 presents the effective algorithm to compute the decision function and discusses the role of the two meta-parameters based on the previous theoretical analysis. In the Appendix (<xref ref-type="supplementary-material" rid="SM1">Supplementary Material</xref>), we collect some technical results.</p>
<sec>
<title>1.1. Sketch of the main result and previous works</title>
<p>In this section we sketch our main result by first recalling the construction of the KPCA estimator introduced in Hoffmann [<xref ref-type="bibr" rid="B16">16</xref>]. We have at disposal a training set <inline-formula><mml:math id="M500"><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>}</mml:mo></mml:mrow><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x02282;</mml:mo><mml:msup><mml:mrow><mml:mi>&#x0211D;</mml:mi></mml:mrow><mml:mrow><mml:mi>d</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula> of <italic>n</italic> points independently sampled according to some probability distribution <italic>P</italic>. The input space <inline-formula><mml:math id="M501"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is a known compact subset of &#x0211D;<sup><italic>d</italic></sup>, but the probability distribution <italic>P</italic> is unknown and the goal is to estimate the support <italic>C</italic> of <italic>P</italic> from the empirical data. We recall that <italic>C</italic> is the smallest closed subset of <inline-formula><mml:math id="M502"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> such that &#x02119;[<italic>C</italic>] &#x0003D; 1 and we stress that <italic>C</italic> is in general a proper subset of <inline-formula><mml:math id="M503"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>, possibly of low dimension.</p>
<p>Classical Principal Component Analysis (PCA) is based on the construction of the vector space <italic>V</italic> spanned by the first <italic>m</italic> eigenvectors associated with the largest eigenvalues of the empirical covariance matrix</p>
<disp-formula id="E1"><mml:math id="M1"><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>n</mml:mi></mml:munderover><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>&#x02212;</mml:mo><mml:mover accent='true'><mml:mi>x</mml:mi><mml:mo>&#x000AF;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo></mml:mrow></mml:mstyle><mml:mo>&#x02297;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>&#x02212;</mml:mo><mml:mover accent='true'><mml:mi>x</mml:mi><mml:mo>&#x000AF;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <inline-formula><mml:math id="M504"><mml:mover accent="false" class="mml-overline"><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo accent="true">&#x000AF;</mml:mo></mml:mover><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:mfrac><mml:munderover accentunder="false" accent="false"><mml:mrow><mml:mo>&#x02211;</mml:mo></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:munderover><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is the empirical mean. However, if the data do not live on an affine subspace, the set <italic>V</italic> is not a consistent estimator of the support. In order to take into account non-linear models, following the idea introduced in Sch&#x000F6;lkopf et al. [<xref ref-type="bibr" rid="B17">17</xref>] we consider a feature map &#x003A6; from the input space <inline-formula><mml:math id="M505"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> into the corresponding feature space <inline-formula><mml:math id="M506"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, which is assumed to be a Hilbert space, and we replace the empirical covariance matrix with the empirical covariance operator</p>
<disp-formula id="E2"><mml:math id="M5"><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo>=</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>n</mml:mi></mml:munderover><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo></mml:mrow></mml:mstyle><mml:msub><mml:mi>x</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02297;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <inline-formula><mml:math id="M507"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:mfrac><mml:munderover accentunder="false" accent="false"><mml:mrow><mml:mo>&#x02211;</mml:mo></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:munderover><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is the empirical mean in the feature space. As it happens in PCA, we consider the subspace <inline-formula><mml:math id="M508"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> of <inline-formula><mml:math id="M509"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> spanned by the first <italic>m</italic>- eigenvectors <inline-formula><mml:math id="M510"><mml:msub><mml:mrow><mml:mover accent="true"><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mover accent="true"><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> of <inline-formula><mml:math id="M511"><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:math></inline-formula>. According to the proposal in Hoffmann [<xref ref-type="bibr" rid="B16">16</xref>], we consider the following estimator of the support of the probability distribution <italic>P</italic></p>
<disp-formula id="E3"><mml:math id="M11"><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mrow><mml:mrow><mml:mrow><mml:mo>&#x02016;</mml:mo><mml:mrow><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>+</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>j</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>m</mml:mi></mml:munderover><mml:mrow><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>f</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>f</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo>&#x02212;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo></mml:mrow></mml:mstyle></mml:mrow></mml:mrow></mml:mrow><mml:mo>&#x02016;</mml:mo></mml:mrow><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mi>&#x003C4;</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow><mml:mo>}</mml:mo></mml:mrow><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where &#x003C4;<sub><italic>n</italic></sub> is a suitable threshold depending on the number of examples and</p>
<disp-formula id="E4"><mml:math id="M12"><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>+</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>j</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>m</mml:mi></mml:munderover><mml:mrow><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>f</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo></mml:mrow></mml:mstyle><mml:msub><mml:mover accent='true'><mml:mi>f</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub></mml:math></disp-formula>
<p>is the projection of an arbitrary point <inline-formula><mml:math id="M512"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> onto the affine subspace <inline-formula><mml:math id="M513"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x0002B;</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>. We show that, under a suitable assumption on the feature map, called <italic>separating property</italic>, <inline-formula><mml:math id="M514"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is a consistent estimator of <italic>C</italic> with respect to the Hausdorff distance between compact sets, see Theorem 3 of section 4.2.</p>
<p>The separating property was introduced in De Vito et al. [<xref ref-type="bibr" rid="B25">25</xref>] and it ensures that the feature space is rich enough to learn any closed subset of <inline-formula><mml:math id="M515"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>. This assumption plays the same role of the notion of universal kernel [<xref ref-type="bibr" rid="B26">26</xref>] in supervised learning.</p>
<p>Moreover, following [<xref ref-type="bibr" rid="B25">25</xref>, <xref ref-type="bibr" rid="B27">27</xref>] we extend the KPCA estimator to a class of learning algorithms defined in terms of a low-pass filter function <italic>r</italic><sub><italic>m</italic></sub>(&#x003C3;) acting on the spectrum of the covariance matrix and depending on a regularization parameter <italic>m</italic> &#x02208; &#x02115;. The projection of <inline-formula><mml:math id="M516"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mo>&#x003A6;</mml:mo></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> onto <inline-formula><mml:math id="M517"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is replaced by the vector</p>
<disp-formula id="E5"><mml:math id="M19"><mml:msub><mml:mover accent='true'><mml:mo>&#x003A6;</mml:mo><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mrow><mml:mi>n</mml:mi><mml:mo>,</mml:mo><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>j</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munderover><mml:mrow><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>f</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>f</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <inline-formula><mml:math id="M518"><mml:msub><mml:mrow><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent="true"><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is the family of eigenvectors of <inline-formula><mml:math id="M519"><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:math></inline-formula> and <inline-formula><mml:math id="M520"><mml:msub><mml:mrow><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent="true"><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is the corresponding family of eigenvalues. The support is then estimated by the set</p>
<disp-formula id="E6"><mml:math id="M23"><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>+</mml:mo><mml:msub><mml:mover accent='true'><mml:mo>&#x003A6;</mml:mo><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mrow><mml:mi>n</mml:mi><mml:mo>,</mml:mo><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mi>&#x003C4;</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0007D;</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Note that KPCA corresponds to the choice of the hard-cut off filter</p>
<disp-formula id="E7"><mml:math id="M24"><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mtable columnalign='left'><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mn>1</mml:mn></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:mi>i</mml:mi><mml:mo>&#x02264;</mml:mo><mml:mi>m</mml:mi></mml:mrow></mml:mtd></mml:mtr><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mn>0</mml:mn></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:mi>i</mml:mi><mml:mo>&#x0003E;</mml:mo><mml:mi>m</mml:mi></mml:mrow></mml:mtd></mml:mtr></mml:mtable></mml:mrow></mml:mrow><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>However, other filter functions can be considered, inspired by the theory of regularization for inverse problems [<xref ref-type="bibr" rid="B28">28</xref>] and by supervised learning algorithms [<xref ref-type="bibr" rid="B29">29</xref>, <xref ref-type="bibr" rid="B30">30</xref>]. In this paper we show that the explicit computation of these spectral estimators reduces to a finite dimensional problem depending only on the kernel <italic>K</italic>(<italic>x, w</italic>) &#x0003D; &#x02329;&#x003A6;(<italic>x</italic>), &#x003A6;(<italic>w</italic>)&#x0232A; associated with the feature map, as for KPCA. The computational properties of each learning algorithm depend on the choice of the low-pass filter <italic>r</italic><sub><italic>m</italic></sub>(&#x003C3;), which can be tuned to out-perform of some specific data set, see the discussion in Rudi et al. [<xref ref-type="bibr" rid="B31">31</xref>].</p>
<p>We conclude this section with two considerations. First, in De Vito et al. [<xref ref-type="bibr" rid="B25">25</xref>, <xref ref-type="bibr" rid="B27">27</xref>] it is proven a consistency result for a similar estimator, where the subspace <inline-formula><mml:math id="M521"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>,</mml:mo><mml:mi>m</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is computed with respect to the non-centered covariance matrix in the feature space <inline-formula><mml:math id="M522"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, instead of the covariance matrix. In this paper we analyze the impact of recentering the data in the feature space <inline-formula><mml:math id="M523"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> on the support estimation problem, see Theorem 1 below. This point of view is further analyzed in Rudi et al. [<xref ref-type="bibr" rid="B32">32</xref>, <xref ref-type="bibr" rid="B33">33</xref>].</p>
<p>Finally note that, our consistency results are based on convergence rates of empirical subspaces to true subspaces of the covariance operator, see Theorem 2 below. The main difference between our result and the result in Blanchard et al. [<xref ref-type="bibr" rid="B34">34</xref>], is that we prove the consistency for the case when the dimension <italic>m</italic> &#x0003D; <italic>m</italic><sub><italic>n</italic></sub> of the subspace <inline-formula><mml:math id="M524"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> goes to infinity slowly enough. On the contrary, in their seminal paper [<xref ref-type="bibr" rid="B34">34</xref>] the authors analyze the most specific case when the dimension of the projection space is fixed.</p>
</sec>
</sec>
<sec id="s2">
<title>2. Mathematical assumptions</title>
<p>In this section we introduce the statistical model generating the data, the notion of separating feature map and the properties of the filter function. Furthermore, we show that KPCA can be seen as a filter function and we recall the main properties of the covariance operators.</p>
<p>We assume that the input space <inline-formula><mml:math id="M525"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is a bounded closed subset of &#x0211D;<sup><italic>d</italic></sup>. However, our results also hold true by replacing <inline-formula><mml:math id="M526"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> with any compact metric space. We denote by d(<italic>x, w</italic>) the Euclidean distance |<italic>x</italic> &#x02212; <italic>w</italic>| between two points <italic>x, w</italic> &#x02208; &#x0211D;<sup><italic>d</italic></sup> and by d<sub><sub><italic>H</italic></sub></sub>(<italic>A, B</italic>) the Hausdorff distance between two compact subsets <inline-formula><mml:math id="M527"><mml:mi>A</mml:mi><mml:mo>,</mml:mo><mml:mi>B</mml:mi><mml:mo>&#x02282;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>, explicitly given by</p>
<disp-formula id="E8"><mml:math id="M32"><mml:msub><mml:mi>d</mml:mi><mml:mrow><mml:msub><mml:mrow></mml:mrow><mml:mi>H</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>A</mml:mi><mml:mo>,</mml:mo><mml:mi>B</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mi>max</mml:mi><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>A</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>B</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>B</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mo>}</mml:mo></mml:mrow><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <inline-formula><mml:math id="M528"><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">d</mml:mtext></mml:mstyle><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>A</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:msub><mml:mrow><mml:mo class="qopname">inf</mml:mo></mml:mrow><mml:mrow><mml:mi>w</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>A</mml:mi></mml:mrow></mml:msub><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">d</mml:mtext></mml:mstyle><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>w</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula>.</p>
<sec>
<title>2.1. Statistical model</title>
<p>The statistical model is described by a random vector <italic>X</italic> taking value in <inline-formula><mml:math id="M529"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>. We denote by <italic>P</italic> the probability distribution of <italic>X</italic>, defined on the Borel &#x003C3;-algebra of <inline-formula><mml:math id="M530"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>, and by <italic>C</italic> the support of <italic>P</italic>.</p>
<p>Since the probability distribution <italic>P</italic> is unknown, so is its support. We aim to estimate <italic>C</italic> from a training set of empirical data, which are described by a family <italic>X</italic><sub>1</sub>, &#x02026;, <italic>X</italic><sub><italic>n</italic></sub> of random vectors, which are independent and identically distributed as <italic>X</italic>. More precisely, we are looking for a closed subset <inline-formula><mml:math id="M531"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mo>&#x02282;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>, depending only on <italic>X</italic><sub>1</sub>, &#x02026;, <italic>X</italic><sub><italic>n</italic></sub>, but independent of <italic>P</italic>, such that</p>
<disp-formula id="E9"><mml:math id="M37"><mml:mi>&#x02119;</mml:mi><mml:mrow><mml:mo>[</mml:mo><mml:mrow><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:msub><mml:mi>d</mml:mi><mml:mrow><mml:msub><mml:mrow></mml:mrow><mml:mi>H</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:mi>C</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow><mml:mo>]</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:math></disp-formula>
<p>for all probability distributions <italic>P</italic>. In the context of regression estimate, the above convergence is usually called universal strong consistency [<xref ref-type="bibr" rid="B35">35</xref>].</p>
</sec>
<sec>
<title>2.2. Mercer feature maps and separating condition</title>
<p>To define the estimator <inline-formula><mml:math id="M532"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> we first map the data into a suitable feature space, so that the support <italic>C</italic> is represented by a linear subspace.</p>
<p>Assumption 1. <italic>Given a Hilbert space <inline-formula><mml:math id="M533"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, take <inline-formula><mml:math id="M534"><mml:mo>&#x003A6;</mml:mo><mml:mo>:</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x02192;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> satisfying the following properties</italic>:</p>
<list list-type="simple">
<list-item><p><italic>(H1) the set <inline-formula><mml:math id="M535"><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is total in <inline-formula><mml:math id="M536"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula></italic>, i.e.,
<disp-formula id="E10"><mml:math id="M43"><mml:mover accent='true'><mml:mrow><mml:mtext>span</mml:mtext></mml:mrow><mml:mo stretchy='true'>&#x000AF;</mml:mo></mml:mover><mml:mo>&#x0007B;</mml:mo><mml:mover accent='true'><mml:mo>&#x003A6;</mml:mo><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02223;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x0007D;</mml:mo><mml:mo>=</mml:mo><mml:mi mathvariant="-tex-caligraphic">H</mml:mi><mml:mo>,</mml:mo></mml:math></disp-formula>
<italic>where <inline-formula><mml:math id="M537"><mml:mover accent="false" class="mml-overline"><mml:mrow><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">span</mml:mtext></mml:mstyle></mml:mrow><mml:mo accent="true">&#x000AF;</mml:mo></mml:mover><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mo>&#x000B7;</mml:mo></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:math></inline-formula> denotes the closure of the linear span</italic>;</p></list-item>
<list-item><p><italic>(H2) the map &#x003A6; is continuous</italic>.</p></list-item>
</list>
<p><italic>The space <inline-formula><mml:math id="M538"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> is called the feature space and the map</italic> &#x003A6; <italic>is called a</italic> Mercer feature map.</p>
<p>In the following the norm and scalar product of <inline-formula><mml:math id="M539"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> are denoted by ||&#x000B7;|| and &#x02329;&#x000B7;&#x000B7;&#x0232A;, respectively.</p>
<p>Assumptions (H1) and (H2) are standard for kernel methods, see Steinwart and Christmann [<xref ref-type="bibr" rid="B36">36</xref>]. We now briefly recall some basic consequences. First of all, the map <inline-formula><mml:math id="M540"><mml:mi>K</mml:mi><mml:mo>:</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x000D7;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x02192;</mml:mo><mml:mi>&#x0211D;</mml:mi></mml:math></inline-formula></p>
<disp-formula id="E11"><mml:math id="M48"><mml:mi>K</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>w</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>w</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo></mml:math></disp-formula>
<p>is a Mercer kernel and we denote by <inline-formula><mml:math id="M541"><mml:msub><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:mrow><mml:mrow><mml:mi>K</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> the corresponding (separable) reproducing kernel Hilbert space, whose elements are continuous functions on <inline-formula><mml:math id="M542"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>. Moreover, each element <inline-formula><mml:math id="M543"><mml:mi>f</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> defines a function <inline-formula><mml:math id="M544"><mml:msub><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mo>&#x003A6;</mml:mo></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:mrow><mml:mrow><mml:mi>K</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> by setting <italic>f</italic><sub>&#x003A6;</sub>(<italic>x</italic>) &#x0003D; &#x02329;<italic>f</italic>, &#x003A6;(<italic>x</italic>)&#x0232A; for all <inline-formula><mml:math id="M545"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>. Since <inline-formula><mml:math id="M546"><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is total in <inline-formula><mml:math id="M547"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, the linear map <italic>f</italic> &#x021A6; <italic>f</italic><sub>&#x003A6;</sub> is an isometry from <inline-formula><mml:math id="M548"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> onto <inline-formula><mml:math id="M549"><mml:msub><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:mrow><mml:mrow><mml:mi>K</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>. In the following, with slight abuse of notation, we write <italic>f</italic> instead of <italic>f</italic><sub>&#x003A6;</sub>, so that the elements <inline-formula><mml:math id="M550"><mml:mi>f</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> are viewed as functions on <inline-formula><mml:math id="M551"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> satisfying the reproducing property</p>
<disp-formula id="E12"><mml:math id="M60"><mml:mi>f</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mi>f</mml:mi><mml:mo>,</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Finally, since <inline-formula><mml:math id="M552"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is compact and &#x003A6; is continuous, it holds that</p>
<disp-formula id="E13"><label>(1)</label><mml:math id="M62"><mml:mi>R</mml:mi><mml:mo>=</mml:mo><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:munder><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:mo>=</mml:mo><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:munder><mml:mi>K</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0003C;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Following De Vito et al. [<xref ref-type="bibr" rid="B27">27</xref>], we call &#x003A6; a <italic>separating Mercer feature map</italic> if the following <italic>the separating property</italic> also holds true.</p>
<list list-type="simple">
<list-item><p><italic>(H3)</italic> The map &#x003A6; is injective and for all closed subsets <inline-formula><mml:math id="M553"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow><mml:mo>&#x02282;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula></p>
<p><disp-formula id="E14"><label>(2)</label><mml:math id="M64"><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi mathvariant="-tex-caligraphic">C</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02229;</mml:mo><mml:mover accent='true'><mml:mrow><mml:mtext>span</mml:mtext></mml:mrow><mml:mo stretchy='true'>&#x000AF;</mml:mo></mml:mover><mml:mo>&#x0007B;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02223;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">C</mml:mi><mml:mo>&#x0007D;</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula></p></list-item>
</list>
<p>It states that any closed subset <inline-formula><mml:math id="M554"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow><mml:mo>&#x02282;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is mapped by &#x003A6; onto the intersection of <inline-formula><mml:math id="M555"><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> and the closed subspace <inline-formula><mml:math id="M556"><mml:mover accent="false" class="mml-overline"><mml:mrow><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">span</mml:mtext></mml:mstyle></mml:mrow><mml:mo accent="true">&#x000AF;</mml:mo></mml:mover><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>&#x02223;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow></mml:mrow><mml:mo>}</mml:mo></mml:mrow><mml:mo>&#x02282;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>. Examples of kernels satisfying the separating property are for <inline-formula><mml:math id="M557"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x02282;</mml:mo><mml:msup><mml:mrow><mml:mi>&#x0211D;</mml:mi></mml:mrow><mml:mrow><mml:mi>d</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula> [<xref ref-type="bibr" rid="B27">27</xref>]:
<list list-type="bullet">
<list-item><p>Sobolev kernels with smoothness index <inline-formula><mml:math id="M558"><mml:mi>s</mml:mi><mml:mo>&#x0003E;</mml:mo><mml:mfrac><mml:mrow><mml:mi>d</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:mfrac></mml:math></inline-formula>;</p></list-item>
<list-item><p>the Abel/Laplacian kernel <italic>K</italic>(<italic>x, w</italic>) &#x0003D; <italic>e</italic><sup> &#x02212; &#x003B3;|<italic>x</italic> &#x02212; <italic>w</italic>|</sup> with &#x003B3; &#x0003E; 0;</p></list-item>
<list-item><p>the &#x02113;<sub>1</sub>-kernel <inline-formula><mml:math id="M559"><mml:mi>K</mml:mi><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>w</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:msup><mml:mrow><mml:mi>e</mml:mi></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mi>&#x003B3;</mml:mi><mml:mo>|</mml:mo><mml:mi>x</mml:mi><mml:mo>-</mml:mo><mml:mi>w</mml:mi><mml:msub><mml:mrow><mml:mo>|</mml:mo></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub></mml:mrow></mml:msup></mml:math></inline-formula>, where |&#x000B7;|<sub>1</sub> is the &#x02113;<sub>1</sub>-norm and &#x003B3; &#x0003E; 0.</p></list-item>
</list></p>
<p>As shown in De Vito et al. [<xref ref-type="bibr" rid="B25">25</xref>], given a closed set <inline-formula><mml:math id="M560"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow></mml:math></inline-formula> the equality (2) is equivalent to the condition that for every <inline-formula><mml:math id="M561"><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mn>0</mml:mn></mml:mrow></mml:msub><mml:mo>&#x02209;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow></mml:math></inline-formula> there exists <inline-formula><mml:math id="M562"><mml:mi>f</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> such that
<disp-formula id="E15"><label>(3)</label><mml:math id="M74"><mml:mi>f</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mn>0</mml:mn></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02260;</mml:mo><mml:mn>0</mml:mn><mml:mtext>&#x02003;&#x02003;and&#x02003;&#x02003;</mml:mtext><mml:mi>f</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mtext>&#x02003;</mml:mtext><mml:mo>&#x02200;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">C</mml:mi><mml:mo>.</mml:mo></mml:math></disp-formula></p>
<p>Clearly, an arbitrary Mercer feature map is not able to separate all the closed subsets, but only few of them. To better describe these sets, we introduce the <italic>elementary learnable</italic> sets, namely</p>
<disp-formula id="E16"><mml:math id="M75"><mml:msub><mml:mi mathvariant="-tex-caligraphic">C</mml:mi><mml:mi>f</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mi>f</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mi>f</mml:mi><mml:mo>,</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo>&#x0007D;</mml:mo><mml:mo>,</mml:mo><mml:mtext>&#x000A0;</mml:mtext></mml:math></disp-formula>
<p>where <inline-formula><mml:math id="M563"><mml:mi>f</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>. Clearly, <inline-formula><mml:math id="M564"><mml:msub><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow></mml:mrow><mml:mrow><mml:mi>f</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is closed and the equality (3) holds true. Furthermore the intersection of an arbitrary family of elementary learnable sets <inline-formula><mml:math id="M565"><mml:msub><mml:mrow><mml:mo>&#x02229;</mml:mo></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">F</mml:mi></mml:mrow></mml:mrow></mml:msub><mml:msub><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> with <inline-formula><mml:math id="M566"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">F</mml:mi></mml:mrow><mml:mo>&#x02282;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> satisfies (3), too. Conversely, if <inline-formula><mml:math id="M567"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow></mml:math></inline-formula> is a set satisfying (2), select a maximal family {<italic>f</italic><sub><italic>j</italic></sub>}<sub><italic>j</italic>&#x02208;<italic>J</italic></sub> of orthonormal functions in <inline-formula><mml:math id="M568"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> such that</p>
<disp-formula id="E17"><mml:math id="M82"><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:mo>&#x02200;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">C</mml:mi><mml:mo>,</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:mi>j</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>J</mml:mi><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>i.e., a basis of the orthogonal complement of <inline-formula><mml:math id="M569"><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>&#x02223;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:math></inline-formula>, then it is easy to prove that</p>
<disp-formula id="E92"><label>(4)</label><mml:math id="M800"><mml:mi mathvariant="-tex-caligraphic">C</mml:mi><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mtext>&#x000A0;</mml:mtext><mml:mo>&#x02200;</mml:mo><mml:mi>j</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>J</mml:mi><mml:mo>&#x0007D;</mml:mo><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02229;</mml:mo><mml:mrow><mml:mi>j</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>J</mml:mi></mml:mrow></mml:munder><mml:mrow><mml:msub><mml:mi>C</mml:mi><mml:mrow><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub></mml:mrow></mml:msub></mml:mrow></mml:mstyle><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>so that any set which is separating by &#x003A6; is the (possibly denumerable) intersection of elementary sets. Assumption (H3) is hence a requirement that the family of the elementary learnable sets, labeled by the elements of <inline-formula><mml:math id="M570"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, is rich enough to parameterize all the closed subsets of <inline-formula><mml:math id="M571"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> by means of (4). In section 4.3 we present some examples.</p>
<p>The Gaussian kernel <italic>K</italic>(<italic>x, w</italic>) &#x0003D; <italic>e</italic><sup>&#x02212;&#x003B3;|<italic>x</italic>&#x02212;<italic>w</italic>|2</sup> is a popular choice in machine learning, however it is not separating. Indeed, since <italic>K</italic> is analytic, the elements of the corresponding reproducing kernel Hilbert space are analytic functions, too [<xref ref-type="bibr" rid="B36">36</xref>]. It is known that, given an analytic function <italic>f</italic> &#x02260; 0, the corresponding elementary learnable set <inline-formula><mml:math id="M572"><mml:msub><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">C</mml:mi></mml:mrow></mml:mrow><mml:mrow><mml:mi>f</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x02223;</mml:mo><mml:mi>f</mml:mi><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:math></inline-formula> is a closed set whose interior is the empty set. Hence also the denumerable intersections have empty interior, so that <italic>K</italic> can not separate a support with not-empty interior. In Figure <xref ref-type="fig" rid="F1">1</xref> we compare the decay behavior of the eigenvalues of the Laplacian and the Gaussian kernels.</p>
<fig id="F1" position="float">
<label>Figure 1</label>
<caption><p>Eigenvalues in logarithmic scale of the Covariance operator when the kernel is Abel (blue) and Gaussian (red) and the distribution is uniformly supported on the &#x0201C;8&#x0201D; curve in Figure <xref ref-type="fig" rid="F2">2</xref>. Note that the eigenvalue decay rate of the first operator has a polynomial behavior while the second has an exponential one.</p></caption>
<graphic xlink:href="fams-03-00023-g0001.tif"/>
</fig>
</sec>
<sec>
<title>2.3. Filter function</title>
<p>The second building block is a low pass filter, we introduce to avoid that the estimator overfits the empirical data. The filter functions were first introduced in the context of inverse problem, see Engl et al. [<xref ref-type="bibr" rid="B28">28</xref>] and references therein, and in the context of supervised learning, see Lo Gerfo et al. [<xref ref-type="bibr" rid="B29">29</xref>] and Blanchard and Mucke [<xref ref-type="bibr" rid="B30">30</xref>].</p>
<p>We now fix some notations. For any <inline-formula><mml:math id="M573"><mml:mi>f</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, we denote by <italic>f</italic> &#x02297; <italic>f</italic> the rank one operator (<italic>f</italic> &#x02297; <italic>f</italic>)<italic>g</italic> &#x0003D; &#x02329;<italic>gf</italic>&#x0232A;<italic>f</italic>. We recall that a bounded operator <italic>A</italic> on <inline-formula><mml:math id="M574"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> is a Hilbert-Schmidt operator if for some (any) basis {<italic>f</italic><sub><italic>j</italic></sub>}<sub><italic>j</italic></sub> the series <inline-formula><mml:math id="M575"><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:mi>A</mml:mi><mml:mo>|</mml:mo><mml:msubsup><mml:mrow><mml:mo>|</mml:mo></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msubsup><mml:mo>:</mml:mo><mml:mo>=</mml:mo><mml:munder class="msub"><mml:mrow><mml:mo>&#x02211;</mml:mo></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:munder><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:mi>A</mml:mi><mml:msub><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo>|</mml:mo><mml:msup><mml:mrow><mml:mo>|</mml:mo></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula> is finite, ||<italic>A</italic>||<sub>2</sub> is called the Hilbert-Schmidt norm and ||<italic>A</italic>||<sub>&#x0221E;</sub> &#x02264; ||<italic>A</italic>||<sub>2</sub>, where ||&#x000B7;||<sub>&#x0221E;</sub> is the spectral norm. We denote by <inline-formula><mml:math id="M576"><mml:msub><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">S</mml:mi></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msub></mml:math></inline-formula> the space of Hilbert-Schmidt operators, which is a separable Hilbert space under the scalar product <inline-formula><mml:math id="M577"><mml:msub><mml:mrow><mml:mrow><mml:mo>&#x02329;</mml:mo><mml:mrow><mml:mi>A</mml:mi><mml:mi>B</mml:mi></mml:mrow><mml:mo>&#x0232A;</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:munder class="msub"><mml:mrow><mml:mo>&#x02211;</mml:mo></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:munder><mml:mrow><mml:mo>&#x02329;</mml:mo><mml:mrow><mml:mi>A</mml:mi><mml:msub><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mi>B</mml:mi><mml:msub><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>&#x0232A;</mml:mo></mml:mrow></mml:math></inline-formula>.</p>
<p>Assumption 2. <italic>A filter function is a sequence of functions r<sub>m</sub></italic>:[0, <italic>R</italic>] &#x02192; [0, 1], <italic>with m &#x02208; &#x02115;, satisfying</italic></p>
<list list-type="simple">
<list-item><p><italic>(H4) for any m</italic> &#x02208; &#x02115;, <italic>r</italic><sub><italic>m</italic></sub>(0) &#x0003D; 0;</p></list-item>
<list-item><p><italic>(H5) for all</italic> &#x003C3; &#x0003E; 0, <inline-formula><mml:math id="M578"><mml:mrow><mml:mstyle displaystyle='true'><mml:munder><mml:mrow><mml:mo class="qopname">lim</mml:mo></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>&#x0002B;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder></mml:mstyle><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:math></inline-formula>;</p></list-item>
<list-item><p><italic>(H6) for all m</italic> &#x02208; &#x02115;, <italic>there is L<sub>m</sub></italic> &#x0003E; 0 <italic>such that</italic>
<disp-formula id="E18"><mml:math id="M93"><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msup><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x02032;</mml:mo></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mi>L</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x02032;</mml:mo></mml:msup><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0007C;</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<italic>i.e., r<sub>m</sub> is a Lipschitz function with Lipschitz constant L<sub>m</sub></italic>.</p></list-item>
</list>
<p>For fixed <italic>m</italic>, <italic>r</italic><sub><italic>m</italic></sub> is a filter cutting the smallest eigenvalues (high frequencies). Indeed, (H4) and (H6) with &#x003C3;&#x02032; &#x0003D; 0 give</p>
<disp-formula id="E19"><label>(5)</label><mml:math id="M94"><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mi>L</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0007C;</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>On the contrary, if <italic>m</italic> goes to infinity, by (H5) <italic>r</italic><sub><italic>m</italic></sub> converges point-wisely to the Heaviside function</p>
<disp-formula id="E20"><mml:math id="M95"><mml:mi>&#x00398;</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mtable columnalign='left'><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mn>1</mml:mn></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0003E;</mml:mo><mml:mn>0</mml:mn></mml:mrow></mml:mtd></mml:mtr><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mn>0</mml:mn></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow></mml:mtd></mml:mtr></mml:mtable></mml:mrow></mml:mrow><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Since <italic>r</italic><sub><italic>m</italic></sub>(&#x003C3;) converges to &#x00398;(&#x003C3;), which does not satisfy (5), we have that <inline-formula><mml:math id="M579"><mml:munder class="msub"><mml:mrow><mml:mo class="qopname">lim</mml:mo></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>&#x0002B;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:msub><mml:mrow><mml:mi>L</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x0002B;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:math></inline-formula>.</p>
<p>We fix the interval [0, <italic>R</italic>] as domain of the filter functions <italic>r</italic><sub><italic>m</italic></sub> since the eigenvalues of the operators we are interested belong to [0, <italic>R</italic>], see (23).</p>
<p>Examples of filter functions are</p>
<list list-type="bullet">
<list-item><p>Tikhonov filter
<disp-formula id="E21"><mml:math id="M97"><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mi>m</mml:mi><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mi>&#x003C3;</mml:mi><mml:mo>+</mml:mo><mml:mi>R</mml:mi></mml:mrow></mml:mfrac><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:msub><mml:mi>L</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mfrac><mml:mi>m</mml:mi><mml:mi>R</mml:mi></mml:mfrac><mml:mo>.</mml:mo></mml:math></disp-formula></p></list-item>
<list-item><p>Soft cut-off
<disp-formula id="E22"><mml:math id="M98"><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mtable><mml:mtr><mml:mtd><mml:mn>1</mml:mn></mml:mtd><mml:mtd><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x02265;</mml:mo><mml:mfrac><mml:mi>R</mml:mi><mml:mi>m</mml:mi></mml:mfrac></mml:mrow></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mrow><mml:mfrac><mml:mrow><mml:mi>m</mml:mi><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mi>R</mml:mi></mml:mfrac></mml:mrow></mml:mtd><mml:mtd><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0003C;</mml:mo><mml:mfrac><mml:mi>R</mml:mi><mml:mi>m</mml:mi></mml:mfrac></mml:mrow></mml:mtd></mml:mtr></mml:mtable></mml:mrow></mml:mrow><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:msub><mml:mi>L</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mfrac><mml:mi>m</mml:mi><mml:mi>R</mml:mi></mml:mfrac><mml:mo>.</mml:mo></mml:math></disp-formula></p></list-item>
<list-item><p>Landweber iteration
<disp-formula id="E23"><mml:math id="M99"><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mfrac><mml:mi>&#x003C3;</mml:mi><mml:mi>R</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>k</mml:mi><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow><mml:mi>m</mml:mi></mml:munderover><mml:mrow><mml:msup><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mn>1</mml:mn><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mi>&#x003C3;</mml:mi><mml:mi>R</mml:mi></mml:mfrac><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mi>k</mml:mi></mml:msup><mml:mo>=</mml:mo><mml:mn>1</mml:mn><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mn>1</mml:mn><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mi>&#x003C3;</mml:mi><mml:mi>R</mml:mi></mml:mfrac><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>+</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mtext>&#x02003;</mml:mtext><mml:msub><mml:mi>L</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mi>m</mml:mi><mml:mo>+</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>R</mml:mi></mml:mfrac><mml:mo>.</mml:mo></mml:mrow></mml:mstyle></mml:math></disp-formula></p></list-item>
</list>
<p>We recall a technical result, which is based on functional calculus for compact operators. If <italic>A</italic> is a positive Hilbert-Schmidt operator, Hilbert-Schmidt theorem (for compact self-adjoint operators) gives that there exist a basis {<italic>f</italic><sub><italic>j</italic></sub>}<sub><italic>j</italic></sub> of <inline-formula><mml:math id="M580"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> and a family {&#x003C3;<sub><italic>j</italic></sub>}<sub><italic>j</italic></sub> of positive numbers such that</p>
<disp-formula id="E24"><label>(6)</label><mml:math id="M101"><mml:mi>A</mml:mi><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>j</mml:mi></mml:munder><mml:mrow><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mi>j</mml:mi></mml:msub></mml:mrow></mml:mstyle><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>&#x02297;</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:mo>&#x021D4;</mml:mo><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:mi>A</mml:mi><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>If the spectral norm ||<italic>A</italic>||<sub>&#x0221E;</sub> &#x02264; <italic>R</italic>, then all the eigenvalues &#x003C3;<sub><italic>j</italic></sub> belong to [0, <italic>R</italic>] and the spectral calculus defines <italic>r</italic><sub><italic>m</italic></sub>(<italic>A</italic>) as the operator on <inline-formula><mml:math id="M581"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> given by</p>
<disp-formula id="E25"><mml:math id="M103"><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>j</mml:mi></mml:munder><mml:mrow><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>&#x02297;</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:mo>&#x021D4;</mml:mo><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>With this definition each <italic>f</italic><sub><italic>j</italic></sub> is still an eigenvector of <italic>r</italic><sub><italic>m</italic></sub>(<italic>A</italic>), but the corresponding eigenvalue is shrunk to <italic>r</italic><sub><italic>m</italic></sub>(&#x003C3;<sub><italic>j</italic></sub>). Proposition 1 in the Appendix in <xref ref-type="supplementary-material" rid="SM1">Supplementary Material</xref> summarizes the main properties of <italic>r</italic><sub><italic>m</italic></sub>(<italic>A</italic>).</p>
</sec>
<sec>
<title>2.4. Kernel principal component analysis</title>
<p>As anticipated in the introduction, the estimators we propose are a generalization of KPCA suggested by Hoffmann [<xref ref-type="bibr" rid="B16">16</xref>] in the context of novelty detection. In our framework this corresponds to the hard cut-off filter, i.e., by labeling the different eigenvalues of <italic>A</italic> in a decreasing order<xref ref-type="fn" rid="fn0001"><sup>1</sup></xref> &#x003C3;<sub>1</sub> &#x0003E; &#x003C3;<sub>2</sub> &#x0003E; &#x02026; &#x0003E; &#x003C3;<sub><italic>m</italic></sub> &#x0003E; &#x003C3;<sub><italic>m</italic>&#x0002B;1</sub> &#x0003E; &#x02026;, the filter function is</p>
<disp-formula id="E26"><mml:math id="M104"><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003C3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mtable columnalign='left'><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mn>1</mml:mn></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x02265;</mml:mo><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mi>m</mml:mi></mml:msub></mml:mrow></mml:mtd></mml:mtr><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mn>0</mml:mn></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0003C;</mml:mo><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mi>m</mml:mi></mml:msub></mml:mrow></mml:mtd></mml:mtr></mml:mtable></mml:mrow></mml:mrow><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Clearly, <italic>r</italic><sub><italic>m</italic></sub> satisfies (H4) and (H5), but (H6) does not hold. However, the Lipschitz assumption is needed only to prove the bound (21e) and, for the hard cut-off filter, <italic>r</italic><sub><italic>m</italic></sub>(<italic>A</italic>) is simply the orthogonal projector onto the linear space spanned by the eigenvectors whose eigenvalues are bigger than &#x003C3;<sub><italic>m</italic>&#x0002B;1</sub>. For such projections [<xref ref-type="bibr" rid="B37">37</xref>] proves the following bound</p>
<disp-formula id="E27"><mml:math id="M105"><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msup><mml:mi>A</mml:mi><mml:mo>&#x02032;</mml:mo></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msub><mml:mo>&#x02264;</mml:mo><mml:mfrac><mml:mn>2</mml:mn><mml:mrow><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mrow><mml:mi>m</mml:mi><mml:mo>+</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>&#x003C3;</mml:mi><mml:mi>m</mml:mi></mml:msub></mml:mrow></mml:mfrac><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mi>A</mml:mi><mml:mo>&#x02032;</mml:mo></mml:msup><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msub><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>so that (21e) holds true with <inline-formula><mml:math id="M582"><mml:msub><mml:mrow><mml:mi>L</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mn>2</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfrac></mml:math></inline-formula>. Hence, our results also hold for hard cut-off filter at the price to have a Lipschitz constant <italic>L</italic><sub><italic>m</italic></sub> depending on the eigenvalues of <italic>A</italic>.</p>
</sec>
<sec>
<title>2.5. Covariance operators</title>
<p>The third building block is made of the eigenvectors of the distribution dependent covariance operator and of its empirical version. The covariance operators are computed by first mapping the data in the feature space <inline-formula><mml:math id="M583"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>.</p>
<p>As usual, we introduce two random variables &#x003A6;(<italic>X</italic>) and &#x003A6;(<italic>X</italic>) &#x02297; &#x003A6;(<italic>X</italic>), taking value in <inline-formula><mml:math id="M584"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> and in <inline-formula><mml:math id="M585"><mml:msub><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">S</mml:mi></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msub></mml:math></inline-formula>, respectively. Since &#x003A6; is continuous and <italic>X</italic> belongs to the compact subset <inline-formula><mml:math id="M586"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>, both random variables are bounded. We set</p>
<disp-formula id="E28"><label>(7a)</label><mml:math id="M111"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:mi>&#x003BC;</mml:mi><mml:mo>=</mml:mo><mml:mi>&#x1D53C;</mml:mi><mml:mo stretchy='false'>[</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>X</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>]</mml:mo><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:mrow><mml:munder><mml:mo>&#x0222B;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:munder><mml:mo>&#x003A6;</mml:mo></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mi>d</mml:mi><mml:mi>P</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<disp-formula id="E29"><label>(7b)</label><mml:math id="M112"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:mi>T</mml:mi><mml:mo>=</mml:mo><mml:mi>&#x1D53C;</mml:mi><mml:mo stretchy='false'>[</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>X</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02297;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>X</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>]</mml:mo><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:mrow><mml:munder><mml:mo>&#x0222B;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:munder><mml:mo>&#x003A6;</mml:mo></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02297;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mi>d</mml:mi><mml:mi>P</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<disp-formula id="E30"><label>(7c)</label><mml:math id="M113"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:msup><mml:mi>T</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo>=</mml:mo><mml:mi>T</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x02297;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>where the integrals are in the Bochner sense.</p>
<p>We denote by <inline-formula><mml:math id="M587"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> and <inline-formula><mml:math id="M588"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> the empirical mean of &#x003A6;(<italic>X</italic>) and &#x003A6;(<italic>X</italic>) &#x02297; &#x003A6;(<italic>X</italic>), respectively, and by <inline-formula><mml:math id="M589"><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:math></inline-formula> the empirical covariance operator, respectively. Explicitly,</p>
<disp-formula id="E31"><label>(8a)</label><mml:math id="M117"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>i</mml:mi></mml:munder><mml:mo>&#x003A6;</mml:mo></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<disp-formula id="E32"><label>(8b)</label><mml:math id="M118"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:msub><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>i</mml:mi></mml:munder><mml:mo>&#x003A6;</mml:mo></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02297;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<disp-formula id="E33"><label>(8c)</label><mml:math id="M119"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover><mml:mo>=</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x02297;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>The main properties of the covariance operator and its empirical version are summarized in Proposition 2 in the Appendix in <xref ref-type="supplementary-material" rid="SM1">Supplementary Material</xref>.</p>
</sec>
</sec>
<sec id="s3">
<title>3. The estimator</title>
<p>Now we are ready to construct the estimator, whose computational aspects are discussed in section 5. The set <inline-formula><mml:math id="M590"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is defined by the following three steps:</p>
<list list-type="alpha-lower">
<list-item><p>the points <inline-formula><mml:math id="M591"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> are mapped into the corresponding centered vectors <inline-formula><mml:math id="M592"><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, where the center is the empirical mean;</p></list-item>
<list-item><p>the operator <inline-formula><mml:math id="M593"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is applied to each vector <inline-formula><mml:math id="M594"><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>;</p></list-item>
<list-item><p>the point <inline-formula><mml:math id="M595"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is assigned to <inline-formula><mml:math id="M596"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> if the distance between <inline-formula><mml:math id="M597"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math id="M598"><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is smaller than a threshold &#x003C4;.</p></list-item>
</list>
<p>Explicitly we have that</p>
<disp-formula id="E34"><label>(9)</label><mml:math id="M129"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mi>&#x003C4;</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0007D;</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>where &#x003C4; &#x0003D; &#x003C4;<sub><italic>n</italic></sub> and <italic>m</italic> &#x0003D; <italic>m</italic><sub><italic>n</italic></sub> are chosen as a function of the number <italic>n</italic> of training data.</p>
<p>With the choice of the hard cut-off filter, this reduces to the KPCA algorithm [<xref ref-type="bibr" rid="B16">16</xref>, <xref ref-type="bibr" rid="B17">17</xref>]. Indeed, <inline-formula><mml:math id="M599"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is the projection <italic>Q</italic><sup><italic>m</italic></sup> onto the vector space spanned by the first <italic>m</italic> eigenvectors. Hence <inline-formula><mml:math id="M600"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is the set of points <italic>x</italic> whose image <inline-formula><mml:math id="M601"><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is close to <italic>Q</italic><sup><italic>m</italic></sup>. For an arbitrary filter function <italic>r</italic><sub><italic>m</italic></sub>, <italic>Q</italic><sup><italic>m</italic></sup> is replaced by <inline-formula><mml:math id="M602"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula>, which can be interpreted as a smooth version of <italic>Q</italic><sup><italic>m</italic></sup>. Note that, in general, <inline-formula><mml:math id="M603"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is not a projection.</p>
<p>In De Vito et al. [<xref ref-type="bibr" rid="B27">27</xref>] a different estimator is defined. In that paper the data are mapped in the feature space <inline-formula><mml:math id="M604"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> without centering the points with respect to the empirical mean and the estimator is given by</p>
<disp-formula id="E35"><mml:math id="M136"><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x002DC;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msubsup><mml:mi>&#x003C4;</mml:mi><mml:mi>n</mml:mi><mml:mn>2</mml:mn></mml:msubsup><mml:mo>&#x0007D;</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where the filter function <italic>r</italic><sub><italic>m</italic></sub> is as in the present work, but <inline-formula><mml:math id="M605"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is defined in terms of the eigenvectors of the non-centered second momentum <inline-formula><mml:math id="M606"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>. To compare the two estimators note that</p>
<disp-formula id="E36"><mml:math id="M139"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:msup><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mrow><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msubsup><mml:mi>r</mml:mi><mml:mi>m</mml:mi><mml:mo>&#x02217;</mml:mo></mml:msubsup><mml:mo stretchy='false'>(</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>where <inline-formula><mml:math id="M607"><mml:msubsup><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mo>*</mml:mo></mml:mrow></mml:msubsup><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>2</mml:mn><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:msup><mml:mrow><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula>, which is a filter function too, possibly with a Lipschitz constant <inline-formula><mml:math id="M608"><mml:msubsup><mml:mrow><mml:mi>L</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mo>*</mml:mo></mml:mrow></mml:msubsup><mml:mo>&#x02264;</mml:mo><mml:mn>2</mml:mn><mml:msub><mml:mrow><mml:mi>L</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>. Note that for the hard cut-off filter <inline-formula><mml:math id="M609"><mml:msubsup><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mo>*</mml:mo></mml:mrow></mml:msubsup><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula>.</p>
<p>Though <inline-formula><mml:math id="M610"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math id="M611"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> are different, both <inline-formula><mml:math id="M612"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> and <inline-formula><mml:math id="M613"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>&#x0007E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> converge to the support of the probability distribution <italic>P</italic>, provided that the separating property (H3) holds true. Hence, one has the freedom to choose if the empirical data have or not zero mean in the feature space.</p>
</sec>
<sec id="s4">
<title>4. Main results</title>
<p>In this section, we prove that the estimator <inline-formula><mml:math id="M614"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> we introduce is strongly consistent. To state our results, for each <italic>n</italic> &#x02208; &#x02115;, we fix an integer <italic>m</italic><sub><italic>n</italic></sub> &#x02208; &#x02115; and set <inline-formula><mml:math id="M615"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>:</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x02192;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula> to be</p>
<disp-formula id="E37"><mml:math id="M149"><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>so that Equation (9) becomes</p>
<disp-formula id="E38"><label>(10)</label><mml:math id="M150"><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mi>&#x003C4;</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0007D;</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula>
<sec>
<title>4.1. Spectral characterization</title>
<p>First of all, we characterize the support of <italic>P</italic> by means of <italic>Q</italic><sup><italic>c</italic></sup>, the orthogonal projector onto the null space of the distribution dependence covariance operator <italic>T</italic><sup><italic>c</italic></sup>. The following theorem will show that the centered feature map</p>
<disp-formula id="E39"><mml:math id="M151"><mml:msup><mml:mo>&#x003A6;</mml:mo><mml:mi>c</mml:mi></mml:msup><mml:mo>:</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mi mathvariant="-tex-caligraphic">H</mml:mi><mml:mstyle class="text"><mml:mtext>&#x000A0;&#x000A0;</mml:mtext></mml:mstyle><mml:msup><mml:mo>&#x003A6;</mml:mo><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi></mml:math></disp-formula>
<p>sends the support <italic>C</italic> onto the intersection of <inline-formula><mml:math id="M616"><mml:msup><mml:mrow><mml:mo>&#x003A6;</mml:mo></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> and the closed subspace <inline-formula><mml:math id="M617"><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>I</mml:mi><mml:mo>-</mml:mo><mml:msup><mml:mrow><mml:mi>Q</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, <italic>i.e</italic>,</p>
<disp-formula id="E40"><mml:math id="M154"><mml:msup><mml:mo>&#x003A6;</mml:mo><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mi>C</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:msup><mml:mo>&#x003A6;</mml:mo><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02229;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mi mathvariant="-tex-caligraphic">H</mml:mi><mml:mo>.</mml:mo></mml:math></disp-formula>
<p><bold>Theorem 1</bold>. <italic>Assume that</italic> &#x003A6; <italic>is a separating Mercer feature map, then</italic></p>
<disp-formula id="E41"><label>(11)</label><mml:math id="M155"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:mi>C</mml:mi><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo>&#x0007D;</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p><italic>where <italic>Q</italic><sup><italic>c</italic></sup> is the orthogonal projector onto the null space of the covariance operator <italic>T</italic><sup><italic>c</italic></sup></italic>.</p>
<p><italic>Proof</italic>. To prove the result we need some technical lemmas, we state and prove in the Appendix in <xref ref-type="supplementary-material" rid="SM1">Supplementary Material</xref>. Assume first that <inline-formula><mml:math id="M618"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is such that <italic>Q</italic><sup><italic>c</italic></sup>(&#x003A6;(<italic>x</italic>) &#x02212; &#x003BC;) &#x0003D; 0. Denoted by <italic>Q</italic> the orthogonal projection onto the null space of <italic>T</italic>, by Lemma 2 <italic>QQ</italic><sup><italic>c</italic></sup> &#x0003D; <italic>Q</italic> and <italic>Q&#x003BC;</italic> &#x0003D; 0, so that</p>
<disp-formula id="E42"><mml:math id="M157"><mml:mi>Q</mml:mi><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mi>Q</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mi>Q</mml:mi><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0.</mml:mn></mml:math></disp-formula>
<p>Hence Lemma 1 implies that <italic>x</italic> &#x02208; <italic>C</italic>.</p>
<p>Conversely, if <italic>x</italic> &#x02208; <italic>C</italic>, then as above <italic>Q</italic>(&#x003A6;(<italic>x</italic>) &#x02212; &#x003BC;) &#x0003D; 0. By Lemma 2 we have that <italic>Q</italic><sup><italic>c</italic></sup>(1 &#x02212; <italic>Q</italic>) &#x0003D; ||<italic>Q</italic><sup><italic>c</italic></sup>&#x003BC;||<sup>&#x02212;2</sup><italic>Q</italic><sup><italic>c</italic></sup> &#x003BC; &#x02297; <italic>Q</italic><sup><italic>c</italic></sup>&#x003BC;. Hence it is enough to prove that</p>
<disp-formula id="E43"><mml:math id="M158"><mml:mo>&#x02329;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0232A;</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo>&#x021D4;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mi>&#x003BC;</mml:mi><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>which holds true by Lemma 3.</p>
</sec>
<sec>
<title>4.2. Consistency</title>
<p>Our first result is about the convergence of <inline-formula><mml:math id="M619"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>.</p>
<p><bold>Theorem 2</bold>. <italic>Assume that</italic> &#x003A6; <italic>is a Mercer feature map. Take the sequence {<italic>m</italic><sub><italic>n</italic></sub>}<sub><italic>n</italic></sub> such that</italic></p>
<disp-formula id="E44"><label>(12a)</label><mml:math id="M160"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<disp-formula id="E45"><label>(12b)</label><mml:math id="M161"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:msub><mml:mi>L</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo>&#x02264;</mml:mo><mml:mi>&#x003BA;</mml:mi><mml:mfrac><mml:mrow><mml:msqrt><mml:mi>n</mml:mi></mml:msqrt></mml:mrow><mml:mrow><mml:mi>ln</mml:mi><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mi>n</mml:mi></mml:mrow></mml:mfrac><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p><italic>for some constant</italic> &#x003BA; &#x0003E; 0, <italic>then</italic></p>
<disp-formula id="E46"><label>(13)</label><mml:math id="M162"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:mi>&#x02119;</mml:mi><mml:mo stretchy='true'>[</mml:mo><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:munder><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo stretchy='true'>]</mml:mo><mml:mo>=</mml:mo><mml:mn>1.</mml:mn></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p><italic>Proof</italic>. We first prove Equation (13). Set <inline-formula><mml:math id="M620"><mml:msub><mml:mrow><mml:mi>A</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mi>I</mml:mi><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula>. Given <inline-formula><mml:math id="M621"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>,</p>
<disp-formula id="E47"><mml:math id="M165"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>A</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x02264;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>A</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>+</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>A</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x02264;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msup><mml:mi>T</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;&#x000A0;</mml:mtext></mml:mstyle><mml:mo>+</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msup><mml:mi>T</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>+</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>A</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x02264;</mml:mo><mml:mn>2</mml:mn><mml:msqrt><mml:mi>R</mml:mi></mml:msqrt><mml:msub><mml:mi>L</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>T</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msub></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>+</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msup><mml:mi>T</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>+</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>where the fourth line is due to (21e), the bound <inline-formula><mml:math id="M622"><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mi>A</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mo>|</mml:mo></mml:mrow><mml:mrow><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:munder class="msub"><mml:mrow><mml:mo class="qopname">sup</mml:mo></mml:mrow><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mo>[</mml:mo><mml:mrow><mml:mn>0</mml:mn><mml:mo>,</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo>]</mml:mo></mml:mrow></mml:mrow></mml:munder><mml:mo>|</mml:mo><mml:mn>1</mml:mn><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>|</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mn>1</mml:mn></mml:math></inline-formula>, and the fact that both &#x003A6;(<italic>x</italic>) and &#x003BC; are bounded by <inline-formula><mml:math id="M623"><mml:msqrt><mml:mrow><mml:mi>R</mml:mi></mml:mrow></mml:msqrt></mml:math></inline-formula>. By (12b) it follows that</p>
<disp-formula id="E48"><mml:math id="M"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:munder><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>A</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mn>2</mml:mn><mml:msqrt><mml:mi>R</mml:mi></mml:msqrt><mml:mi>&#x003BA;</mml:mi><mml:mfrac><mml:mrow><mml:msqrt><mml:mi>n</mml:mi></mml:msqrt></mml:mrow><mml:mrow><mml:mi>ln</mml:mi><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mi>n</mml:mi></mml:mrow></mml:mfrac><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>T</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msub></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;&#x000A0;</mml:mtext></mml:mstyle><mml:mo>+</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:munder><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mrow><mml:msub><mml:mi>m</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msup><mml:mi>T</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>so that, taking into account (24a) and (24c), it holds that</p>
<disp-formula id="E49"><mml:math id="M1000"><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:munder><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mi>A</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:math></disp-formula>
<p>almost surely, provided that lim<sub><italic>n</italic>&#x02192;+&#x0221E;</sub>&#x02225;(<italic>r<sub>m<sub>n</sub></sub></italic>(<italic>T<sup>c</sup></italic>) &#x02212; (<italic>I</italic> &#x02212; <italic>Q</italic><sup><italic>c</italic></sup>))(&#x003A6;(<italic>x</italic>) &#x02212; &#x003BC;)&#x02225; &#x0003D; 0. This last limit is a consequence of (21d) observing that <inline-formula><mml:math id="M624"><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:math></inline-formula> is compact since <inline-formula><mml:math id="M625"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is compact and &#x003A6; is continuous.</p>
<p>We add some comments. Theorem 1 suggests that the consistency depends on the fact that the vector <inline-formula><mml:math id="M626"><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>I</mml:mi><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is a good approximation of <italic>Q</italic><sup><italic>c</italic></sup>(&#x003A6;(<italic>x</italic>)&#x02212;&#x003BC;). By the law of large numbers, <inline-formula><mml:math id="M627"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> and <inline-formula><mml:math id="M628"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> converge to <italic>T</italic> and &#x003BC;, respectively, and Equation (21d) implies that, if <italic>m</italic> is large enough, (<italic>I</italic> &#x02212; <italic>r</italic><sub><italic>m</italic></sub>(<italic>T</italic>))(&#x003A6;(<italic>x</italic>)&#x02212;&#x003BC;) is closed to <italic>Q</italic><sup><italic>c</italic></sup>(&#x003A6;(<italic>x</italic>)&#x02212;&#x003BC;). Hence, if <italic>m</italic><sub><italic>n</italic></sub> is large enough, see condition (12a), we expect that <inline-formula><mml:math id="M629"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is close to <inline-formula><mml:math id="M630"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula>. However, this is true only if <italic>m</italic><sub><italic>n</italic></sub> goes to infinity slowly enough, see condition (12b). The rate depends on the behavior of the Lipschitz constant <italic>L</italic><sub><italic>m</italic></sub>, which goes to infinity if <italic>m</italic> goes to infinity. For example, for Tikhonov filter a sufficient condition is that <inline-formula><mml:math id="M631"><mml:msub><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x0007E;</mml:mo><mml:msup><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mfrac><mml:mrow><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:mfrac><mml:mo>-</mml:mo><mml:mi>&#x003F5;</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula> with &#x003F5; &#x0003E; 0. With the right choice of <italic>m</italic><sub><italic>n</italic></sub>, the empirical decision function <inline-formula><mml:math id="M632"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> converges uniformly to the function <italic>F</italic>(<italic>x</italic>) &#x0003D; <italic>Q</italic><sup><italic>c</italic></sup>(&#x003A6;(<italic>x</italic>) &#x02212; &#x003BC;), see Equation (13).</p>
<p>If the map &#x003A6; is separating, Theorem 1 gives that the zero level set of <italic>F</italic> is precisely the support <italic>C</italic>. However, if <italic>C</italic> is not learnable by &#x003A6;, i.e., the equality (2) does not hold, then the zero level set of <italic>F</italic> is bigger than <italic>C</italic>. For example, if <inline-formula><mml:math id="M633"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is connected, <italic>C</italic> has not-empty interior and &#x003A6; is the feature map associated with the Gaussian kernel, it is possible to prove that <italic>F</italic> is an analytic function, which is zero on an open set, hence it is zero on the whole space <inline-formula><mml:math id="M634"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>. We note that, in real applications the difference between Gaussian and Abel kernel, which is separating, is not so big and in our experience the Gaussian kernel provides a reasonable estimator.</p>
<p>From now on we assume that &#x003A6; is separating, so that Theorem 1 holds true. However, the uniform convergence of <inline-formula><mml:math id="M635"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> to <italic>F</italic> does not imply that the zero level sets of <inline-formula><mml:math id="M636"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> converges to <italic>C</italic> &#x0003D; <italic>F</italic><sup>&#x02212;1</sup>(0) with respect to the Hausdorff distance. For example, with the Tikhonov filter <inline-formula><mml:math id="M637"><mml:msubsup><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mn>0</mml:mn></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is always the empty set. To overcome the problem, <inline-formula><mml:math id="M638"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is defined as the &#x003C4;<sub><italic>n</italic></sub>-neighborhood of the zero level set of <inline-formula><mml:math id="M639"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>, where the threshold &#x003C4;<sub><italic>m</italic></sub> goes to zero slowly enough.</p>
<p>Define the data dependent parameter <inline-formula><mml:math id="M640"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> as</p>
<disp-formula id="E50"><label>(14)</label><mml:math id="M180"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:msub><mml:mover accent='true'><mml:mi>&#x003C4;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:munder><mml:mrow><mml:mi>max</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn><mml:mo>&#x02264;</mml:mo><mml:mi>i</mml:mi><mml:mo>&#x02264;</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:munder><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>Since <inline-formula><mml:math id="M641"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mo>[</mml:mo><mml:mrow><mml:mn>0</mml:mn><mml:mo>,</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo>]</mml:mo></mml:mrow></mml:math></inline-formula>, clearly <inline-formula><mml:math id="M642"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mo>[</mml:mo><mml:mrow><mml:mn>0</mml:mn><mml:mo>,</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo>]</mml:mo></mml:mrow></mml:math></inline-formula> and the set estimator becomes</p>
<disp-formula id="E51"><mml:math id="M183"><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C4;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0007D;</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>The following result shows that <inline-formula><mml:math id="M643"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is a universal strongly consistent estimator of the support of the probability distribution <italic>P</italic>. Note that for KPCA the consistency is not universal since the choice of <italic>m</italic><sub><italic>n</italic></sub> depends on some a-priori information about the decay of the eigenvalues of the covariance operator <italic>T</italic><sup><italic>c</italic></sup>, which depends on <italic>P</italic>.</p>
<p><bold>Theorem 3</bold>. <italic>Assume that &#x003A6; is a separating Mercer feature map. Take the sequence {<italic>m</italic><sub><italic>n</italic></sub>}<sub><italic>n</italic></sub> satisfying (12a)-(12b) and define <inline-formula><mml:math id="M644"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> by (14). Then</italic></p>
<disp-formula id="E52"><label>(15a)</label><mml:math id="M186"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:mi>&#x02119;</mml:mi><mml:mo stretchy='false'>[</mml:mo><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:msub><mml:mover accent='true'><mml:mi>&#x003C4;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo stretchy='false'>]</mml:mo><mml:mo>=</mml:mo><mml:mn>1</mml:mn><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<disp-formula id="E53"><label>(15b)</label><mml:math id="M187"><mml:mtable class="eqnarray" columnalign="left"><mml:mtr><mml:mtd><mml:mi>&#x02119;</mml:mi><mml:mo stretchy='false'>[</mml:mo><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:msub><mml:mi>d</mml:mi><mml:mrow><mml:msub><mml:mrow></mml:mrow><mml:mi>H</mml:mi></mml:msub></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:mi>C</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo stretchy='false'>]</mml:mo><mml:mo>=</mml:mo><mml:mn>1.</mml:mn></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p><italic>Proof</italic>. We first show Equation (15a). Set <italic>F</italic>(<italic>x</italic>) &#x0003D; <italic>Q</italic><sup><italic>c</italic></sup>(&#x003A6;(<italic>x</italic>) &#x02212; &#x003BC;) and let <italic>E</italic> be the event on which <inline-formula><mml:math id="M645"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> converges uniformly to <italic>F</italic>(<italic>x</italic>), and <italic>F</italic> be the event such that <italic>X</italic><sub><italic>i</italic></sub> &#x02208; <italic>C</italic> for all <italic>i</italic> &#x02265; 1. Theorem 2 shows that &#x02119;[<italic>E</italic>] &#x0003D; 1 and, since <italic>C</italic> is the support, then &#x02119;[<italic>F</italic>] &#x0003D; 1. Take &#x003C9; &#x02208; <italic>E</italic> &#x02229; <italic>F</italic> and fix &#x003F5; &#x0003E; 0, then there exists <italic>n</italic><sub>0</sub> &#x0003E; 0 (possibly depending on &#x003C9; and &#x003F5;) such that for all <italic>n</italic> &#x02265; <italic>n</italic><sub>0</sub> <inline-formula><mml:math id="M646"><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:mi>F</mml:mi><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>|</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mi>&#x003F5;</mml:mi></mml:math></inline-formula> for all <inline-formula><mml:math id="M647"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>. By Theorem 1 <italic>F</italic>(<italic>x</italic>) &#x0003D; 0 for all <italic>x</italic> &#x02208; <italic>C</italic> and <italic>X</italic><sub>1</sub>(&#x003C9;), &#x02026;, <italic>X</italic><sub><italic>n</italic></sub>(&#x003C9;) &#x02208; <italic>C</italic>, it follows that <inline-formula><mml:math id="M648"><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C9;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>|</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mi>&#x003F5;</mml:mi></mml:math></inline-formula> for all 1 &#x02264; <italic>i</italic> &#x02264; <italic>n</italic> so that <inline-formula><mml:math id="M649"><mml:mn>0</mml:mn><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C9;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>&#x02264;</mml:mo><mml:mi>&#x003F5;</mml:mi></mml:math></inline-formula>, so that the sequence <inline-formula><mml:math id="M650"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C9;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> goes to zero. Since &#x02119;[<italic>E</italic> &#x02229; <italic>F</italic>] &#x0003D; 1 Equation (15a) holds true.</p>
<p>We split the proof of Equation (15b) in two steps. We first show that with probability one <inline-formula><mml:math id="M651"><mml:munder class="msub"><mml:mrow><mml:mo class="qopname">lim</mml:mo></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>&#x0002B;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:munder class="msub"><mml:mrow><mml:mo class="qopname">sup</mml:mo></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo class="qopname">^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:munder><mml:mi>d</mml:mi><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>C</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:math></inline-formula>. On the event <italic>E</italic> &#x02229; <italic>F</italic>, suppose, by contraction, that the sequence <inline-formula><mml:math id="M652"><mml:msub><mml:mrow><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mo class="qopname">sup</mml:mo></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo class="qopname">^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">d</mml:mtext></mml:mstyle><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>C</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> does not converge to zero. Possibly passing to a subsequence, for all <italic>n</italic> &#x02208; &#x02115; there exists <inline-formula><mml:math id="M653"><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> such that <inline-formula><mml:math id="M654"><mml:mi>d</mml:mi><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>&#x02265;</mml:mo><mml:msub><mml:mrow><mml:mi>&#x003F5;</mml:mi></mml:mrow><mml:mrow><mml:mn>0</mml:mn></mml:mrow></mml:msub></mml:math></inline-formula> for some fixed &#x003F5;<sub>0</sub> &#x0003E; 0. Since <inline-formula><mml:math id="M655"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> is compact, possibly passing to a subsequence, {<italic>x</italic><sub><italic>n</italic></sub>}<sub><italic>n</italic></sub> converges to <inline-formula><mml:math id="M656"><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mn>0</mml:mn></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> with d(<italic>x</italic><sub>0</sub>, <italic>C</italic>) &#x02265; &#x003F5;<sub>0</sub>. We claim that <italic>x</italic><sub>0</sub> &#x02208; <italic>C</italic>. Indeed,</p>
<disp-formula id="E54"><mml:math id="M200"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mn>0</mml:mn></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x02264;</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mn>0</mml:mn></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>+</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>+</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x02264;</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mn>0</mml:mn></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:mo>+</mml:mo><mml:mstyle class="text"><mml:mtext>&#x000A0;</mml:mtext></mml:mstyle><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:munder><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>Q</mml:mi><mml:mi>c</mml:mi></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mi>&#x003BC;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:msub><mml:mi>&#x003C4;</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>since <inline-formula><mml:math id="M657"><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> means that <inline-formula><mml:math id="M658"><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>. If <italic>n</italic> goes to infinity, since &#x003A6; is continuous and by the definition of <italic>E</italic> and <italic>F</italic>, the right side of the above inequality goes to zero, so that <inline-formula><mml:math id="M659"><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:msup><mml:mrow><mml:mi>Q</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mn>0</mml:mn></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:math></inline-formula>, <italic>i.e.</italic>, by Theorem 1 we get <italic>x</italic><sub>0</sub> &#x02208; <italic>C</italic>, which is a contraction since by construction <italic>d</italic>(<italic>x</italic><sub>0</sub>, <italic>C</italic>) &#x02265; &#x003F5;<sub>0</sub> &#x0003E; 0.</p>
<p>We now prove that</p>
<disp-formula id="E55"><mml:math id="M204"><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>For any <inline-formula><mml:math id="M660"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>, set <italic>X</italic><sub>1,<italic>n</italic></sub>(<italic>x</italic>) to be a first neighbor of <italic>x</italic> in the training set {<italic>X</italic><sub>1</sub>, &#x02026;, <italic>X</italic><sub><italic>n</italic></sub>}. It is known that for all <italic>x</italic> &#x02208; <italic>C</italic>,</p>
<disp-formula id="E56"><label>(16)</label><mml:math id="M206"><mml:mi>&#x02119;</mml:mi><mml:mrow><mml:mo>[</mml:mo><mml:mrow><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow><mml:mo>]</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>1</mml:mn><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>see for example Lemma 6.1 of Gy&#x000F6;rfi et al. [<xref ref-type="bibr" rid="B35">35</xref>].</p>
<p>Choose a denumerable family {<sub><italic>z</italic><italic>j</italic></sub>}<sub><italic>j</italic> &#x02208; <italic>J</italic></sub> in <italic>C</italic> such that is dense in <italic>C</italic>. By Equation (16) there exists an event <italic>G</italic> with such that &#x02119;[<italic>G</italic>] &#x0003D; 1 and, on <italic>G</italic>, for all <italic>j</italic> &#x02208; <italic>J</italic></p>
<disp-formula id="E57"><label>(16)</label><mml:math id="M207"><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0.</mml:mn></mml:math></disp-formula>
<p>Fix &#x003C9; &#x02208; <italic>G</italic>, we claim that <inline-formula><mml:math id="M661"><mml:munder class="msub"><mml:mrow><mml:mo class="qopname">lim</mml:mo></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:munder><mml:msub><mml:mrow><mml:mo class="qopname">sup</mml:mo></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:msub><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">d</mml:mtext></mml:mstyle><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo class="qopname">^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:math></inline-formula>. Observe that, by definition of <inline-formula><mml:math id="M662"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>, <inline-formula><mml:math id="M663"><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> for all 1 &#x02264; <italic>i</italic> &#x02264; <italic>n</italic> and</p>
<disp-formula id="E58"><mml:math id="M211"><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02264;</mml:mo><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:munder><mml:munder><mml:mrow><mml:mi>min</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn><mml:mo>&#x02264;</mml:mo><mml:mi>i</mml:mi><mml:mo>&#x02264;</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>so that it is enough to show that <inline-formula><mml:math id="M664"><mml:msub><mml:mi>lim</mml:mi><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:msub><mml:msub><mml:mtext>sup</mml:mtext><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:msub><mml:mtext>d</mml:mtext><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:math></inline-formula>.</p>
<p>Fix &#x003F5; &#x0003E; 0. Since <italic>C</italic> is compact, there is a finite subset <italic>J</italic><sub>&#x003F5;</sub> &#x02282; <italic>J</italic> such that {<italic>B</italic>(<italic>z</italic><sub><italic>j</italic></sub>, &#x003F5;)}<sub><italic>j</italic> &#x02208; <italic>J</italic><sub>&#x003F5;</sub></sub> is a finite covering of <italic>C</italic>. Furthermore,</p>
<disp-formula id="E59"><label>(17)</label><mml:math id="M213"><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02264;</mml:mo><mml:munder><mml:mrow><mml:mi>max</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mi>J</mml:mi><mml:mi>&#x003F5;</mml:mi></mml:msub></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x003F5;</mml:mi><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Indeed, fix <italic>x</italic> &#x02208; <italic>C</italic>, there exists an index <italic>j</italic> &#x02208; <italic>J</italic><sub>&#x003F5;</sub> such that <italic>x</italic> &#x02208; <italic>B</italic>(<italic>z</italic><sub><italic>j</italic></sub>, &#x003F5;). By definition of first neighbor, clearly</p>
<disp-formula id="E60"><mml:math id="M214"><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>so that by triangular inequality we get</p>
<disp-formula id="E61"><mml:math id="M215"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>&#x02264;</mml:mo><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x003F5;</mml:mi></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>&#x02264;</mml:mo><mml:munder><mml:mrow><mml:mi>max</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mi>J</mml:mi><mml:mi>&#x003F5;</mml:mi></mml:msub></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x003F5;</mml:mi><mml:mo>.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>Taking the supremum over <italic>C</italic> we get the claim. Since &#x003C9; &#x02208; <italic>G</italic> and <italic>J</italic><sub>&#x003F5;</sub> is finite,</p>
<disp-formula id="E62"><mml:math id="M216"><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:munder><mml:mrow><mml:mi>max</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mi>J</mml:mi><mml:mi>&#x003F5;</mml:mi></mml:msub></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>z</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>so that by Equation (17)</p>
<disp-formula id="E63"><mml:math id="M217"><mml:munder><mml:mrow><mml:mtext>limsup&#x000A0;</mml:mtext></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02264;</mml:mo><mml:mi>&#x003F5;</mml:mi><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Since &#x003F5; is arbitrary, we get <inline-formula><mml:math id="M665"><mml:munder class="msub"><mml:mrow><mml:mo class="qopname">lim</mml:mo></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>&#x0002B;</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:msub><mml:mrow><mml:mo class="qopname">sup</mml:mo></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:msub><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">d</mml:mtext></mml:mstyle><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>,</mml:mo><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:math></inline-formula>, which implies that</p>
<disp-formula id="E64"><mml:math id="M219"><mml:munder><mml:mrow><mml:mi>lim</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo>&#x02192;</mml:mo><mml:mo>+</mml:mo><mml:mi>&#x0221E;</mml:mi></mml:mrow></mml:munder><mml:munder><mml:mrow><mml:mi>sup</mml:mi></mml:mrow><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi>C</mml:mi></mml:mrow></mml:munder><mml:mtext>d</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>C</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0.</mml:mn></mml:math></disp-formula>
<p>Theorem 3 is an asymptotic result. Up to now, we are not able to provide finite sample bounds on d<sub><italic>H</italic></sub>(&#x00108;<sub><italic>n</italic></sub>, <italic>C</italic>). It is possible to have finite sample bounds on <inline-formula><mml:math id="M666"><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msup><mml:mrow><mml:mi>Q</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>|</mml:mo><mml:mo>|</mml:mo></mml:math></inline-formula>, as in Theorem 7 of De Vito et al. [<xref ref-type="bibr" rid="B25">25</xref>] with the same kind of proof.</p>
</sec>
<sec>
<title>4.3. The separating condition</title>
<p>The following two examples clarify the notion of the separating condition.</p>
<p><bold>Example 1</bold>. Let <inline-formula><mml:math id="M667"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> be a compact subset of &#x0211D;<sup>2</sup>, <inline-formula><mml:math id="M668"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow><mml:mo>=</mml:mo><mml:msup><mml:mrow><mml:mi>&#x0211D;</mml:mi></mml:mrow><mml:mrow><mml:mn>6</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula> with the euclidean scalar product, and <inline-formula><mml:math id="M669"><mml:mo>&#x003A6;</mml:mo><mml:mo>:</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi>&#x0211D;</mml:mi></mml:mrow><mml:mrow><mml:mn>6</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula> be the feature map</p>
<disp-formula id="E65"><mml:math id="M224"><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>y</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msup><mml:mi>x</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>,</mml:mo><mml:msup><mml:mi>y</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>,</mml:mo><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mi>y</mml:mi><mml:mo>,</mml:mo><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>y</mml:mi><mml:mo>,</mml:mo><mml:mn>1</mml:mn><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>whose corresponding Mercer kernel is a polynomial kernel of degree two, explicitly given by</p>
<disp-formula id="E66"><label>(18)</label><mml:math id="M225"><mml:mi>K</mml:mi><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:msub><mml:mi>x</mml:mi><mml:mn>1</mml:mn></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>y</mml:mi><mml:mn>1</mml:mn></mml:msub><mml:mo>;</mml:mo><mml:msub><mml:mi>x</mml:mi><mml:mn>2</mml:mn></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>y</mml:mi><mml:mn>2</mml:mn></mml:msub></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:msup><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:msub><mml:mi>x</mml:mi><mml:mn>1</mml:mn></mml:msub><mml:msub><mml:mi>x</mml:mi><mml:mn>2</mml:mn></mml:msub><mml:mo>+</mml:mo><mml:msub><mml:mi>y</mml:mi><mml:mn>1</mml:mn></mml:msub><mml:msub><mml:mi>y</mml:mi><mml:mn>2</mml:mn></mml:msub><mml:mo>+</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Given a vector <inline-formula><mml:math id="M670"><mml:mi>f</mml:mi><mml:mo>=</mml:mo><mml:msup><mml:mrow><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mn>6</mml:mn></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:mrow></mml:msup></mml:math></inline-formula>, the corresponding elementary set is the conic</p>
<disp-formula id="E67"><mml:math id="M227"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:msub><mml:mi>C</mml:mi><mml:mrow><mml:mi>f</mml:mi><mml:mo>,</mml:mo><mml:mi>c</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>y</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mn>1</mml:mn></mml:msub><mml:msup><mml:mi>x</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mn>2</mml:mn></mml:msub><mml:msup><mml:mi>y</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mn>3</mml:mn></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mi>y</mml:mi></mml:mrow></mml:mrow></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x02003;</mml:mtext><mml:mrow><mml:mrow><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mn>4</mml:mn></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mn>5</mml:mn></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>y</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mn>6</mml:mn></mml:msub><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow><mml:mo>}</mml:mo></mml:mrow><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>Conversely, all the conics are elementary sets. The family of all the intersections of at most five conics, i.e., the sets whose cartesian equation is a system of the form</p>
<disp-formula id="E68"><mml:math id="M228"><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mtable columnalign='left'><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mrow><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>11</mml:mn></mml:mrow></mml:msub><mml:msup><mml:mi>x</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>12</mml:mn></mml:mrow></mml:msub><mml:msup><mml:mi>y</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>13</mml:mn></mml:mrow></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mi>y</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>14</mml:mn></mml:mrow></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>15</mml:mn></mml:mrow></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>y</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>16</mml:mn></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow></mml:mtd></mml:mtr><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mo>&#x022EE;</mml:mo></mml:mtd></mml:mtr><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mrow><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>51</mml:mn></mml:mrow></mml:msub><mml:msup><mml:mi>x</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>52</mml:mn></mml:mrow></mml:msub><mml:msup><mml:mi>y</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>53</mml:mn></mml:mrow></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mi>y</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>54</mml:mn></mml:mrow></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>x</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>55</mml:mn></mml:mrow></mml:msub><mml:msqrt><mml:mn>2</mml:mn></mml:msqrt><mml:mi>y</mml:mi><mml:mo>+</mml:mo><mml:msub><mml:mi>f</mml:mi><mml:mrow><mml:mn>56</mml:mn></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow></mml:mtd></mml:mtr></mml:mtable></mml:mrow></mml:mrow><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <italic>f</italic><sub>11</sub>, &#x02026;, <italic>f</italic><sub>56</sub> &#x02208; &#x0211D;.</p>
<p><bold>Example 2</bold>. The data are the random vectors in &#x0211D;<sup>2</sup></p>
<disp-formula id="E69"><mml:math id="M229"><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>sin</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>a</mml:mi><mml:msub><mml:mi>&#x00398;</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>+</mml:mo><mml:mi>b</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>sin</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>c</mml:mi><mml:msub><mml:mi>&#x00398;</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>+</mml:mo><mml:mi>d</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <italic>a, c</italic> &#x02208; &#x02115;, <italic>b, d</italic> &#x02208; [0, 2&#x003C0;] and &#x00398;<sub>1</sub>, &#x02026;, &#x00398;<sub><italic>n</italic></sub> are independent random variables, each of them uniformly distributed on [0, 2&#x003C0;]. Setting <inline-formula><mml:math id="M671"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow><mml:mo>=</mml:mo><mml:msup><mml:mrow><mml:mrow><mml:mo>[</mml:mo><mml:mrow><mml:mo>-</mml:mo><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo>]</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula>, clearly <inline-formula><mml:math id="M672"><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula> and the support of their common probability distribution is the Lissajous curve</p>
<disp-formula id="E70"><mml:math id="M232"><mml:mi>C</mml:mi><mml:mo>=</mml:mo><mml:msub><mml:mtext>Lis</mml:mtext><mml:mrow><mml:mi>a</mml:mi><mml:mo>,</mml:mo><mml:mi>b</mml:mi><mml:mo>,</mml:mo><mml:mi>c</mml:mi><mml:mo>,</mml:mo><mml:mi>d</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>sin</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>a</mml:mi><mml:mi>&#x003B8;</mml:mi><mml:mo>+</mml:mo><mml:mi>b</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mi>sin</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>c</mml:mi><mml:mi>&#x003B8;</mml:mi><mml:mo>+</mml:mo><mml:mi>d</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mi>&#x003B8;</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mo stretchy='false'>[</mml:mo><mml:mn>0</mml:mn><mml:mo>,</mml:mo><mml:mn>2</mml:mn><mml:mi>&#x003C0;</mml:mi><mml:mo stretchy='false'>]</mml:mo><mml:mo>&#x0007D;</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Figure <xref ref-type="fig" rid="F2">2</xref> shows two examples of Lissajous curves. As a filter function <italic>r</italic><sub><italic>m</italic></sub>, we fix the hard cut-off filter where <italic>m</italic> is the number of eigenvectors corresponding to the highest eigenvalues we keep. We denote by <inline-formula><mml:math id="M673"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> the corresponding estimator given by (10).</p>
<fig id="F2" position="float">
<label>Figure 2</label>
<caption><p>Examples of Lissajous curves for different values of the parameters. <bold>(Left)</bold> <inline-formula><mml:math id="M674"><mml:msub><mml:mrow><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">Lis</mml:mtext></mml:mstyle></mml:mrow><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mn>0</mml:mn><mml:mo>,</mml:mo><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mfrac><mml:mrow><mml:mi>&#x003C0;</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:mfrac></mml:mrow></mml:msub></mml:math></inline-formula>. <bold>(Right)</bold> Lis<sub>2,0.11,1,0.3</sub>.</p></caption>
<graphic xlink:href="fams-03-00023-g0002.tif"/>
</fig>
<p>In the first two tests we use the polynomial kernel (18), so that the elementary learnable sets are conics. One can check that the rank of <italic>T</italic><sup><italic>c</italic></sup> is less or equal than 5. More precisely, if Lis<sub><italic>a,b,c,d</italic></sub> is a conic, the rank of <italic>T</italic><sup><italic>c</italic></sup> is 4 and we need to estimate five parameters, whereas if Lis<sub><italic>a,b,c,d</italic></sub> is not a conic, Lis<sub><italic>a,b,c,d</italic></sub> is not a learnable set and the rank of <italic>T</italic><sup><italic>c</italic></sup> is 5.</p>
<p>In the first test the data are sampled from the distribution supported on the circumference <inline-formula><mml:math id="M675"><mml:msub><mml:mrow><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">Lis</mml:mtext></mml:mstyle></mml:mrow><mml:mrow><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mn>0</mml:mn><mml:mo>,</mml:mo><mml:mn>1</mml:mn><mml:mo>,</mml:mo><mml:mfrac><mml:mrow><mml:mi>&#x003C0;</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:mfrac></mml:mrow></mml:msub></mml:math></inline-formula> (see panel left of Figure <xref ref-type="fig" rid="F2">2</xref>). In Figure <xref ref-type="fig" rid="F3">3</xref> we draw the set <inline-formula><mml:math id="M676"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> for different values of <italic>m</italic> and &#x003C4; when <italic>n</italic> varies. In this toy example <italic>n</italic> &#x0003D; 5 is enough to learn exactly the support, hence for each <italic>n</italic> &#x0003D; 2, &#x02026;, 5 the corresponding values of <italic>m</italic><sub><italic>n</italic></sub> and &#x003C4;<sub><italic>n</italic></sub> are <italic>m</italic><sub><italic>n</italic></sub> &#x0003D; 1, 2, 3, 4 and &#x003C4;<sub><italic>n</italic></sub> &#x0003D; 0.01, 0.005, 0.005, 0.002.</p>
<fig id="F3" position="float">
<label>Figure 3</label>
<caption><p>From left to right, top to bottom. The set <inline-formula><mml:math id="M677"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> with <italic>n</italic>, respectively 2, 3, 4, 5, <italic>m</italic> &#x0003D; 1, 2, 3, 4 and &#x003C4; &#x0003D; 0.1, 0.005, 0.005, 0.002.</p></caption>
<graphic xlink:href="fams-03-00023-g0003.tif"/>
</fig>
<p>In the second test the data are sampled from the distribution supported on the curve Lis<sub>2,0.11,1,0.3</sub>, which is not a conic (see panel right of Figure <xref ref-type="fig" rid="F2">2</xref>). In Figure <xref ref-type="fig" rid="F4">4</xref> we draw the set <inline-formula><mml:math id="M678"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> for <italic>n</italic> &#x0003D; 10, 20, 50, 100, <italic>m</italic> &#x0003D; 4, and &#x003C4; &#x0003D; 0.01. Clearly, <inline-formula><mml:math id="M679"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is not able to estimate Lis<sub>2,0.11,1,0.3</sub>.</p>
<fig id="F4" position="float">
<label>Figure 4</label>
<caption><p>The set <inline-formula><mml:math id="M680"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>4</mml:mn><mml:mo>,</mml:mo><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:mn>01</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula> with <italic>n</italic> respectively 10, 20, 50, 100.</p></caption>
<graphic xlink:href="fams-03-00023-g0004.tif"/>
</fig>
<p>In the third test, we use the Abel kernel with the data sampled from the distribution supported on the curve Lis<sub>2,0.11,1,0.3</sub> (see panel right of Figure <xref ref-type="fig" rid="F2">2</xref>). In Figure <xref ref-type="fig" rid="F5">5</xref> we show the set <inline-formula><mml:math id="M681"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> for <italic>n</italic> &#x0003D; 20, 50, 100, 500, <italic>m</italic> &#x0003D; 5, 20, 30, 50, and &#x003C4; &#x0003D; 0.4, 0.35, 0.3, 0.2. According the fact that the kernel is separating, <inline-formula><mml:math id="M682"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is able to estimate Lis<sub>2,0.11,1,0.3</sub> correctly.</p>
<fig id="F5" position="float">
<label>Figure 5</label>
<caption><p>From left to right and top to bottom. The learned set <inline-formula><mml:math id="M683"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> with <italic>n</italic> respectively of 20, 50, 100, 500, and <italic>m</italic> &#x0003D; 5, 20, 30, 50, &#x003C4; &#x0003D; 0.4, 0.35, 0.3, 0.2.</p></caption>
<graphic xlink:href="fams-03-00023-g0005.tif"/>
</fig>
<p>We now briefly discuss how to select the parameter <italic>m</italic><sub><italic>n</italic></sub> and &#x003C4;<sub><italic>n</italic></sub> from the data. The goal of set-learning problem is to recover the support of the probability distribution generating the data by using the given input observations. Since no output is present, set-learning belongs to the category of unsupervised learning problems, for which there is not a general framework accounting for model selection. However there are some possible strategies (whose analysis is out of the scope of this paper). A first approach, we used in our simulations, is based on the monotonicity properties of <inline-formula><mml:math id="M684"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> with respect to <italic>m</italic>, &#x003C4;. More precisely, given <italic>f</italic> &#x02208; (0, 1), we select (the smallest) <italic>m</italic> and (the biggest) &#x003C4; such that at most <italic>nf</italic> observed points belong to the the estimated set. It is possible to prove that this method is consistent when <italic>f</italic> tends to 1 as the number of observations increases. Another way to select the parameters consists in transforming the set-learning problem is a supervised one and then performing standard model selection techniques like cross validation. In particular set-learning can be casted in a classification problem by associating the observed example to the class &#x0002B;1 and by defining an auxiliary measure &#x003BC; (e.g., uniform on a ball of interest in <inline-formula><mml:math id="M685"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">D</mml:mi></mml:mrow></mml:math></inline-formula>) associated to &#x02212;1, from which <italic>n</italic> i.i.d. points are drawn. It is possible to prove that this last method is consistent when &#x003BC;(supp&#x003C1;) &#x0003D; 0.</p>
</sec>
<sec>
<title>4.4. The role of the regularization</title>
<p>We now explain the role of the filter function. Given a training set <italic>X</italic><sub>1</sub>, &#x02026;, <italic>X</italic><sub><italic>n</italic></sub> of size <italic>n</italic>, the separating property (3) applied to the support of the empirical distribution gives that</p>
<disp-formula id="E71"><mml:math id="M246"><mml:mo>&#x0007B;</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mn>1</mml:mn></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0007D;</mml:mo><mml:mo>=</mml:mo><mml:mo>&#x0007B;</mml:mo><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x02223;</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>Q</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mn>0</mml:mn><mml:mo>&#x0007D;</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <inline-formula><mml:math id="M686"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is the empirical mean and <inline-formula><mml:math id="M687"><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>Q</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover></mml:math></inline-formula> is the orthogonal projection onto the linear space spanned by the family <inline-formula><mml:math id="M688"><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:math></inline-formula>, which are the centered images of the examples. Hence, given a new point <italic>x</italic> &#x02208; <italic>D</italic> the condition <inline-formula><mml:math id="M689"><mml:mo>&#x0007C;</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>Q</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:mo>&#x02264;</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:mi>&#x003C4;</mml:mi></mml:math></inline-formula> with &#x003C4; &#x0226A; 1 is satisfied if only if <italic>x</italic> is close to one of the examples in the training set. Hence the naive estimator <inline-formula><mml:math id="M690"><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:mi mathvariant="-tex-caligraphic">D</mml:mi><mml:mo>&#x0007C;</mml:mo><mml:mrow><mml:mo>&#x02016;</mml:mo><mml:mrow><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>Q</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo>(</mml:mo><mml:mi>x</mml:mi><mml:mo>)</mml:mo></mml:mrow><mml:mo>&#x02212;</mml:mo><mml:mover accent='true'><mml:mrow><mml:msub><mml:mi>&#x003BC;</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mo>)</mml:mo></mml:mrow></mml:mrow><mml:mo>&#x02016;</mml:mo></mml:mrow><mml:mo>&#x02264;</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:math></inline-formula> overfits the data. Hence we would like to replace <inline-formula><mml:math id="M691"><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>Q</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover></mml:math></inline-formula> with an operator, which should be close to the identity on the linear subspace spanned by <inline-formula><mml:math id="M692"><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:math></inline-formula> and it should have a small range. To modulate the two requests, one can consider the following optimization problem</p>
<disp-formula id="E72"><mml:math id="M254"><mml:munder><mml:mrow><mml:mi>min</mml:mi></mml:mrow><mml:mrow><mml:mi>A</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mi>S</mml:mi><mml:mn>2</mml:mn></mml:msub></mml:mrow></mml:munder><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>n</mml:mi></mml:munderover><mml:mrow><mml:msup><mml:mrow><mml:mrow><mml:mo>&#x02016;</mml:mo><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mo>&#x02016;</mml:mo></mml:mrow></mml:mrow><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:mi>&#x003BB;</mml:mi><mml:msubsup><mml:mrow><mml:mrow><mml:mo>&#x02016;</mml:mo><mml:mi>A</mml:mi><mml:mo>&#x02016;</mml:mo></mml:mrow></mml:mrow><mml:mn>2</mml:mn><mml:mn>2</mml:mn></mml:msubsup></mml:mrow></mml:mstyle></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>We note that if <italic>A</italic> is a projection its Hilbert-Schmidt norm ||<italic>A</italic>||<sub>2</sub> is the square root of the dimension of the range of <italic>A</italic>. Since</p>
<disp-formula id="E73"><mml:math id="M255"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>n</mml:mi></mml:munderover><mml:mrow><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>=</mml:mo><mml:mtext>Tr</mml:mtext><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>A</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi></mml:mrow><mml:mo>)</mml:mo></mml:mrow></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>n</mml:mi></mml:munderover><mml:mrow><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02297;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mo>)</mml:mo></mml:mrow></mml:mrow></mml:mstyle></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>=</mml:mo><mml:mtext>Tr</mml:mtext><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>A</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x02322;</mml:mo></mml:mover></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>where Tr(<italic>A</italic>) is the trace, <italic>A</italic><sup>&#x022A4;</sup> is the transpose and <inline-formula><mml:math id="M693"><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:mi>A</mml:mi><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mo>|</mml:mo></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:msqrt><mml:mrow><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">Tr</mml:mtext></mml:mstyle><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>A</mml:mi></mml:mrow><mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:mrow></mml:msup><mml:mi>A</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow></mml:msqrt></mml:math></inline-formula> is the Hilbert-Schmidt norm, then</p>
<disp-formula id="E74"><mml:math id="M257"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>n</mml:mi></mml:munderover><mml:mrow><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:mo>+</mml:mo><mml:mi>&#x003BB;</mml:mi><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mi>A</mml:mi><mml:mo>&#x0007C;</mml:mo><mml:msubsup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn><mml:mn>2</mml:mn></mml:msubsup></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x02003;</mml:mtext><mml:mo>=</mml:mo><mml:mtext>&#x000A0;Tr</mml:mtext><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msup><mml:mi>A</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:msubsup><mml:mover accent='true'><mml:mi>T</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo>&#x000A0;</mml:mo><mml:mo>+</mml:mo><mml:mo>&#x000A0;</mml:mo><mml:msub><mml:mi>&#x003BB;</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:msup><mml:mi>A</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mi>A</mml:mi></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>and the optimal solution is given by</p>
<disp-formula id="E75"><mml:math id="M258"><mml:msub><mml:mi>A</mml:mi><mml:mrow><mml:mtext>opt</mml:mtext></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:msup><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo>+</mml:mo><mml:msub><mml:mi>&#x003BB;</mml:mi><mml:mi>m</mml:mi></mml:msub></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mrow><mml:mo>&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>i.e., <italic>A</italic><sub>opt</sub> is precisely the operator <inline-formula><mml:math id="M694"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> with the Tikhonov filter <inline-formula><mml:math id="M695"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0002B;</mml:mo><mml:mi>&#x003BB;</mml:mi></mml:mrow></mml:mfrac></mml:math></inline-formula> and <inline-formula><mml:math id="M696"><mml:mi>&#x003BB;</mml:mi><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mi>R</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:mfrac></mml:math></inline-formula>. A different choice of the filter function <italic>r</italic><sub><italic>m</italic></sub> corresponds to a different regularization of the least-square problem</p>
<disp-formula id="E76"><mml:math id="M262"><mml:mi>min</mml:mi><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>n</mml:mi></mml:munderover><mml:mrow><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:mi>A</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:mo>.</mml:mo></mml:math></disp-formula>
</sec>
</sec>
<sec id="s5">
<title>5. The kernel machine</title>
<p>In this section we show that the computation of <inline-formula><mml:math id="M697"><mml:mo>|</mml:mo><mml:mo>|</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>|</mml:mo><mml:mo>|</mml:mo></mml:math></inline-formula>, in terms of which is defined the estimator <inline-formula><mml:math id="M698"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>, reduces to a finite dimensional problem, depending only on the Mercer kernel <italic>K</italic>, associated with the feature map. We introduce the centered sampling operator</p>
<disp-formula id="E77"><mml:math id="M265"><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo>:</mml:mo><mml:mi>&#x0210B;</mml:mi><mml:mo>&#x02192;</mml:mo><mml:msup><mml:mi>&#x0211D;</mml:mi><mml:mi>n</mml:mi></mml:msup><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:msub><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mi>f</mml:mi></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mi>i</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mi>f</mml:mi><mml:mo>,</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>whose transpose is given by</p>
<disp-formula id="E78"><mml:math id="M266"><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:msup><mml:mrow></mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mo>:</mml:mo><mml:msup><mml:mi>&#x0211D;</mml:mi><mml:mi>n</mml:mi></mml:msup><mml:mo>&#x02192;</mml:mo><mml:mi>&#x0210B;</mml:mi><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:msup><mml:mrow></mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mi>v</mml:mi></mml:mstyle><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:munder><mml:mrow><mml:msub><mml:mi>v</mml:mi><mml:mi>i</mml:mi></mml:msub></mml:mrow></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <italic>v</italic><sub><italic>i</italic></sub> is the <italic>i</italic>-th entry of the column vector <bold>v</bold> &#x02208; &#x0211D;<sup><italic>n</italic></sup>. Hence, it holds that</p>
<disp-formula id="E79"><mml:math id="M267"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:msup><mml:mrow></mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo>=</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mo>,</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:msup><mml:mrow></mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mo>=</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mtext>I</mml:mtext><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mrow><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mn>1</mml:mn></mml:mstyle><mml:msup><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mn>1</mml:mn></mml:mstyle><mml:mo>&#x022A4;</mml:mo></mml:msup></mml:mrow><mml:mi>n</mml:mi></mml:mfrac><mml:mo stretchy='false'>)</mml:mo><mml:mfrac><mml:mrow><mml:msub><mml:mi>K</mml:mi><mml:mi>n</mml:mi></mml:msub></mml:mrow><mml:mi>n</mml:mi></mml:mfrac><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mtext>I</mml:mtext><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mrow><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mn>1</mml:mn></mml:mstyle><mml:msup><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mn>1</mml:mn></mml:mstyle><mml:mo>&#x022A4;</mml:mo></mml:msup></mml:mrow><mml:mi>n</mml:mi></mml:mfrac><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>where <italic>K</italic><sub><italic>n</italic></sub> is the <italic>n</italic> &#x000D7; <italic>n</italic> matrix whose (<italic>i, j</italic>)-entry is <italic>K</italic>(<italic>X</italic><sub><italic>i</italic></sub>, <italic>X</italic><sub><italic>j</italic></sub>) and I<sub><italic>n</italic></sub> is the identity <italic>n</italic> &#x000D7; <italic>n</italic> matrix, so that the (<italic>i, j</italic>)-entry of <inline-formula><mml:math id="M699"><mml:msubsup><mml:mrow><mml:mi>S</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup><mml:msup><mml:mrow><mml:msubsup><mml:mrow><mml:mi>S</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:mrow></mml:msup></mml:math></inline-formula> is</p>
<disp-formula id="E80"><mml:math id="M269"><mml:mi>K</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>b</mml:mi></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>b</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>a</mml:mi></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>a</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mrow><mml:msup><mml:mi>n</mml:mi><mml:mn>2</mml:mn></mml:msup></mml:mrow></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>a</mml:mi><mml:mo>,</mml:mo><mml:mi>b</mml:mi></mml:mrow></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>a</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>b</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>Denoted by &#x02113; the rank of <inline-formula><mml:math id="M700"><mml:msubsup><mml:mrow><mml:mi>S</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup><mml:msup><mml:mrow><mml:msubsup><mml:mrow><mml:mi>S</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:mrow></mml:msup></mml:math></inline-formula>, take the singular value decomposition of <inline-formula><mml:math id="M701"><mml:msubsup><mml:mrow><mml:mi>S</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup><mml:msup><mml:mrow><mml:msubsup><mml:mrow><mml:mi>S</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:mrow></mml:msup><mml:mo>/</mml:mo><mml:mi>n</mml:mi></mml:math></inline-formula>, i.e.,</p>
<disp-formula id="E81"><mml:math id="M272"><mml:mfrac><mml:mrow><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:msup><mml:mrow></mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:msup></mml:mrow><mml:mi>n</mml:mi></mml:mfrac><mml:mo>=</mml:mo><mml:mi>V</mml:mi><mml:mi>&#x003A3;</mml:mi><mml:msup><mml:mi>V</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <italic>V</italic> is an <italic>n</italic> &#x000D7; &#x02113; matrix whose columns <inline-formula><mml:math id="M702"><mml:msub><mml:mrow><mml:mstyle mathvariant="bold"><mml:mtext>v</mml:mtext></mml:mstyle></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo>&#x02208;</mml:mo><mml:msup><mml:mrow><mml:mi>&#x0211D;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula> are the normalized eigenvectors, <inline-formula><mml:math id="M703"><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:mrow></mml:msup><mml:mi>V</mml:mi><mml:mo>=</mml:mo><mml:msub><mml:mrow><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">I</mml:mtext></mml:mstyle></mml:mrow><mml:mrow><mml:mi>&#x02113;</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>, and &#x003A3; is a diagonal &#x02113; &#x000D7; &#x02113; matrix with the strictly positive eigenvalues on the diagonal, i.e., <inline-formula><mml:math id="M704"><mml:mo>&#x003A3;</mml:mo><mml:mo>=</mml:mo><mml:mstyle class="text"><mml:mtext class="textrm" mathvariant="normal">diag</mml:mtext></mml:mstyle><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>&#x02113;</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula>. Set <inline-formula><mml:math id="M705"><mml:mi>U</mml:mi><mml:mo>=</mml:mo><mml:msup><mml:mrow><mml:msubsup><mml:mrow><mml:mi>S</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:mrow></mml:msup><mml:mi>V</mml:mi><mml:msup><mml:mrow><mml:mo>&#x003A3;</mml:mo></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mfrac><mml:mrow><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:mfrac></mml:mrow></mml:msup></mml:math></inline-formula>, regarded as operator from &#x0211D;<sup>&#x02113;</sup> to <inline-formula><mml:math id="M706"><mml:mrow><mml:mi mathvariant="-tex-caligraphic">H</mml:mi></mml:mrow></mml:math></inline-formula>, then a simple calculation shows that</p>
<disp-formula id="E82"><mml:math id="M278"><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo>=</mml:mo><mml:mi>U</mml:mi><mml:mi>&#x003A3;</mml:mi><mml:msup><mml:mi>U</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mi>U</mml:mi><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:msup><mml:mi>U</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>where <italic>r</italic><sub><italic>m</italic></sub>(&#x003A3;) is the diagonal &#x02113; &#x000D7; &#x02113; matrix</p>
<disp-formula id="E83"><mml:math id="M279"><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mtext>diag</mml:mtext><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mn>1</mml:mn></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>&#x02113;</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>and the equation for <inline-formula><mml:math id="M707"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> holds true since by assumption <italic>r</italic><sub><italic>m</italic></sub>(0) &#x0003D; 0. Hence</p>
<disp-formula id="E84"><label>(19)</label><mml:math id="M281"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>F</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mn>2</mml:mn><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x02003;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>&#x02212;</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:msup><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mi>U</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mn>2</mml:mn><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo stretchy='false'>)</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x02003;</mml:mtext><mml:mo>&#x02212;</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:msup><mml:mrow><mml:mo>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo>)</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:msup><mml:mi>U</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>=</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x0232A;</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mo>&#x02329;</mml:mo><mml:mi>V</mml:mi><mml:msup><mml:mi>&#x003A3;</mml:mi><mml:mrow><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mn>2</mml:mn></mml:mfrac></mml:mrow></mml:msup><mml:mo stretchy='false'>(</mml:mo><mml:mn>2</mml:mn><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo stretchy='false'>)</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x02003;</mml:mtext><mml:mo>&#x02212;</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:msup><mml:mrow><mml:mo>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo>)</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:msup><mml:mi>&#x003A3;</mml:mi><mml:mrow><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mn>2</mml:mn></mml:mfrac></mml:mrow></mml:msup><mml:msup><mml:mi>V</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0232A;</mml:mo><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>=</mml:mo><mml:mi>w</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mi>v</mml:mi></mml:mstyle><mml:msup><mml:mrow><mml:mo>(</mml:mo><mml:mi>x</mml:mi><mml:mo>)</mml:mo></mml:mrow><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:msub><mml:mi>G</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mi>v</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>where the real number <inline-formula><mml:math id="M708"><mml:mi>w</mml:mi><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:mrow><mml:mo>&#x02329;</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo>&#x003A6;</mml:mo><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>&#x003BC;</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>&#x0232A;</mml:mo></mml:mrow></mml:math></inline-formula> is</p>
<disp-formula id="E85"><mml:math id="M283"><mml:mi>w</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mi>K</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mn>2</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>b</mml:mi></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>b</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mrow><mml:msup><mml:mi>n</mml:mi><mml:mn>2</mml:mn></mml:msup></mml:mrow></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>a</mml:mi><mml:mo>,</mml:mo><mml:mi>b</mml:mi></mml:mrow></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>a</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>b</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>the <italic>i</italic>-th entry of the column vector <bold>v</bold>(<italic>x</italic>) &#x02208; &#x0211D;<sup><italic>n</italic></sup> is</p>
<disp-formula id="E86"><mml:math id="M284"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mstyle mathvariant='bold' mathsize='normal'><mml:mi>v</mml:mi></mml:mstyle><mml:msub><mml:mrow><mml:mo>(</mml:mo><mml:mi>x</mml:mi><mml:mo>)</mml:mo></mml:mrow><mml:mi>i</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:msub><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:msubsup><mml:mi>S</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mi>i</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mi>K</mml:mi><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>a</mml:mi></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>a</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x02003;</mml:mtext><mml:mo>&#x02212;</mml:mo><mml:mtext>&#x02003;</mml:mtext><mml:mfrac><mml:mn>1</mml:mn><mml:mi>n</mml:mi></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>b</mml:mi></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>i</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>b</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>+</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mrow><mml:msup><mml:mi>n</mml:mi><mml:mn>2</mml:mn></mml:msup></mml:mrow></mml:mfrac><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>a</mml:mi><mml:mo>,</mml:mo><mml:mi>b</mml:mi></mml:mrow></mml:munder><mml:mi>K</mml:mi></mml:mstyle><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>a</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msub><mml:mi>X</mml:mi><mml:mi>b</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>the diagonal &#x02113; &#x000D7; &#x02113; matrix <inline-formula><mml:math id="M709"><mml:msub><mml:mrow><mml:mi>R</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mo>&#x003A3;</mml:mo></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>=</mml:mo><mml:msup><mml:mrow><mml:mo>&#x003A3;</mml:mo></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mn>2</mml:mn><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mo>&#x003A3;</mml:mo></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:msup><mml:mrow><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mo>&#x003A3;</mml:mo></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> is</p>
<disp-formula id="E87"><mml:math id="M286"><mml:msub><mml:mi>R</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>=</mml:mo><mml:mtext>diag</mml:mtext><mml:mrow><mml:mo>(</mml:mo><mml:mrow><mml:mfrac><mml:mrow><mml:mn>2</mml:mn><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mn>1</mml:mn></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:msup><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mn>1</mml:mn></mml:msub><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup></mml:mrow><mml:mrow><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mn>1</mml:mn></mml:msub></mml:mrow></mml:mfrac><mml:mo>,</mml:mo><mml:mo>&#x02026;</mml:mo><mml:mo>,</mml:mo><mml:mfrac><mml:mrow><mml:mn>2</mml:mn><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>&#x02113;</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:msup><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>&#x02113;</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup></mml:mrow><mml:mrow><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>&#x02113;</mml:mi></mml:msub></mml:mrow></mml:mfrac></mml:mrow><mml:mo>)</mml:mo></mml:mrow><mml:mo>,</mml:mo></mml:math></disp-formula>
<p>and the <italic>n</italic> &#x000D7; <italic>n</italic>-matrix <italic>G</italic><sub><italic>m</italic></sub> is</p>
<disp-formula id="E88"><label>(20)</label><mml:math id="M287"><mml:msub><mml:mi>G</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo>=</mml:mo><mml:mi>V</mml:mi><mml:msub><mml:mi>R</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:msup><mml:mi>V</mml:mi><mml:mo>&#x022A4;</mml:mo></mml:msup><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>In <bold>Algorithm 1</bold> we list the corresponding MatLab Code.</p>
<table-wrap position="float" id="T1">
<label>Algorithm 1</label>
<caption><p>Matlab code for Set Learning.</p></caption>
<table frame="hsides" rules="groups">
<tbody>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;function&#x000A0;[Gm,&#x000A0;mu,&#x000A0;s]&#x000A0;&#x0003D;&#x000A0;learnSet(X,&#x000A0;k,</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;rm,&#x000A0;m)</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;%&#x000A0;X:&#x000A0;n&#x000A0;x&#x000A0;d&#x000A0;matrix&#x000A0;of&#x000A0;training&#x000A0;data</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;%&#x000A0;k:&#x000A0;kernel&#x000A0;type</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;%&#x000A0;rm:&#x000A0;spectral&#x000A0;filter</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;%&#x000A0;m:&#x000A0;regularization&#x000A0;parameter</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;n&#x000A0;&#x0003D;&#x000A0;size(X,1);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;K&#x000A0;&#x0003D;&#x000A0;gram(X,&#x000A0;X,&#x000A0;k);&#x000A0;%computes&#x000A0;the&#x000A0;Gram</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;matrix&#x000A0;with&#x000A0;the&#x000A0;kernel&#x000A0;k</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;mu&#x000A0;&#x0003D;&#x000A0;sum(K,2)/n;</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;s&#x000A0;&#x0003D;&#x000A0;sum(sum(K))/n^2;</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;ScScT&#x000A0;&#x0003D;&#x000A0;(K&#x000A0;-&#x000A0;ones(n,1)<sup>&#x0002A;</sup>mu&#x02032;&#x000A0;-&#x000A0;mu<sup>&#x0002A;</sup>ones(1,</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;n)&#x000A0;&#x0002B;&#x000A0;s);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;[Rm,&#x000A0;V]&#x0003D;&#x000A0;rm(ScScT/n,&#x000A0;m);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;Gm&#x000A0;&#x0003D;&#x000A0;V&#x000A0;<sup>&#x0002A;</sup>&#x000A0;Rm&#x000A0;<sup>&#x0002A;</sup>&#x000A0;V&#x02032;;&#x000A0;%&#x000A0;see&#x000A0;Equation&#x000A0;&#x000A0;(24)</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;end</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;function&#x000A0;y&#x000A0;&#x0003D;&#x000A0;testSet(X,&#x000A0;Gm,&#x000A0;mu,&#x000A0;s,&#x000A0;Y)</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;%&#x000A0;Y:&#x000A0;t&#x000A0;x&#x000A0;d&#x000A0;-matrix&#x000A0;of&#x000A0;test&#x000A0;data</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;%&#x000A0;y:&#x000A0;t-column&#x000A0;vector,&#x000A0;each&#x000A0;entry&#x000A0;is&#x000A0;(23)</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;%&#x000A0;&#x000A0;&#x000A0;&#x000A0;for&#x000A0;the&#x000A0;corresponding&#x000A0;test&#x000A0;point</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;n&#x000A0;&#x0003D;&#x000A0;size(X,1);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;W&#x000A0;&#x0003D;&#x000A0;gram(Y,X,k);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;vx&#x000A0;&#x0003D;&#x000A0;W&#x000A0;-&#x000A0;repmat(sum(W,2)/n,1,size(Y,</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;2))&#x000A0;&#x02026;</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;-&#x000A0;repmat(mu&#x02032;,&#x000A0;size(Y,1),</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;1)&#x0002B;&#x000A0;s;</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;w&#x000A0;&#x0003D;&#x000A0;diag(gram(Y,Y,k))&#x000A0;-&#x000A0;2<sup>&#x0002A;</sup>sum(W,2)/</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;n&#x000A0;&#x0002B;&#x000A0;s;</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;y&#x000A0;&#x0003D;&#x000A0;w&#x000A0;-&#x000A0;diag(vx<sup>&#x0002A;</sup>Gm<sup>&#x0002A;</sup>vx&#x02032;);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;end</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;%----------------</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;%&#x000A0;main&#x000A0;script</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x02026;&#x000A0;%&#x000A0;creation&#x000A0;of&#x000A0;training&#x000A0;set&#x000A0;X&#x000A0;and&#x000A0;test</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;set&#x000A0;Y&#x000A0;and&#x000A0;kernel&#x000A0;width&#x000A0;c</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;[Gm,&#x000A0;mu,&#x000A0;s]&#x000A0;&#x0003D;&#x000A0;learnSet(X,&#x000A0;&#x00040;abel(c),</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x00040;hardcutoff,&#x000A0;m);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;y&#x000A0;&#x0003D;&#x000A0;testSet(X,&#x000A0;Gm,&#x000A0;mu,&#x000A0;s,&#x000A0;Y);</monospace></td>
</tr>
<tr>
<td valign="top" align="left"><monospace>&#x000A0;&#x000A0;&#x000A0;&#x000A0;y&#x000A0; &#x0003C;&#x0003D;&#x000A0;tau;&#x000A0;%&#x000A0;membership&#x000A0;of&#x000A0;test&#x000A0;data</monospace></td>
</tr>
</tbody>
</table>
</table-wrap>
<p>The above equations make clear that both <inline-formula><mml:math id="M710"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> and <inline-formula><mml:math id="M711"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> can be computed in terms of the singular value decomposition (<italic>V</italic>, &#x003A3;) of the <italic>n</italic> &#x000D7; <italic>n</italic> Gram matrix <italic>K</italic><sub><italic>n</italic></sub> and of the filter function <italic>r</italic><sub><italic>m</italic></sub>, so that <inline-formula><mml:math id="M712"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>F</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> belongs to the class of kernel methods and <inline-formula><mml:math id="M713"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is a plug-in estimator. For the hard cut-off filter, one simply has</p>
<disp-formula id="E89"><mml:math id="M292"><mml:msub><mml:mi>R</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:msub><mml:mrow><mml:mo>(</mml:mo><mml:mi>&#x003A3;</mml:mi><mml:mo>)</mml:mo></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mi>i</mml:mi></mml:mrow></mml:msub><mml:mo>=</mml:mo><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:mtable columnalign='left'><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mrow><mml:mfrac><mml:mn>1</mml:mn><mml:mrow><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>i</mml:mi></mml:msub></mml:mrow></mml:mfrac></mml:mrow></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>i</mml:mi></mml:msub><mml:mo>&#x02265;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>m</mml:mi></mml:msub></mml:mrow></mml:mtd></mml:mtr><mml:mtr columnalign='left'><mml:mtd columnalign='left'><mml:mn>0</mml:mn></mml:mtd><mml:mtd columnalign='left'><mml:mrow><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>i</mml:mi></mml:msub><mml:mo>&#x0003C;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>m</mml:mi></mml:msub></mml:mrow></mml:mtd></mml:mtr></mml:mtable></mml:mrow></mml:mrow><mml:mo>.</mml:mo></mml:math></disp-formula>
<p>For real applications, a delicate issue is the choice of the parameters <italic>m</italic> and &#x003C4;, we refer to Rudi et al. [<xref ref-type="bibr" rid="B31">31</xref>] for a detailed discussion. Here, we add some simple remarks.</p>
<p>We first discuss the role of &#x003C4;. According to (10), <inline-formula><mml:math id="M714"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup><mml:mo>&#x02286;</mml:mo><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:msup><mml:mrow><mml:mi>&#x003C4;</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02032;</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msubsup></mml:math></inline-formula> whenever &#x003C4; &#x0003C; &#x003C4;&#x02032;. We exemplify this behavior with the dataset of Example 2. The training set is sampled from the distribution supported on the curve Lis<sub>2, 0.11, 1, 0.3</sub> (see panel right of Figure <xref ref-type="fig" rid="F2">2</xref>) and we compute <inline-formula><mml:math id="M715"><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>C</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> with the Abel kernel, <italic>n</italic> &#x0003D; 100 and <italic>m</italic> ranging over 5, 10, 20, 50. Figure <xref ref-type="fig" rid="F6">6</xref> shows the nested sets when &#x003C4; runs in the associated color-bar.</p>
<fig id="F6" position="float">
<label>Figure 6</label>
<caption><p>From left to right and top to bottom: The family of sets <inline-formula><mml:math id="M716"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mn>5</mml:mn><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>,<inline-formula><mml:math id="M717"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mn>10</mml:mn><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>,<inline-formula><mml:math id="M718"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mn>20</mml:mn><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>,<inline-formula><mml:math id="M719"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mn>50</mml:mn><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> with &#x003C4; varying as in the related colorbar.</p></caption>
<graphic xlink:href="fams-03-00023-g0006.tif"/>
</fig>
<p>Analyzing the role of <italic>m</italic>, we now show that, for the the hard cut-off filter, <inline-formula><mml:math id="M720"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02032;</mml:mi></mml:mrow></mml:msup><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup><mml:mo>&#x02286;</mml:mo><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> whenever <italic>m</italic>&#x02032; &#x02264; <italic>m</italic>. Indeed, this filter satisfies <inline-formula><mml:math id="M721"><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02032;</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow><mml:mo>&#x02264;</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:math></inline-formula> and, since 0 &#x02264; <italic>r</italic><sub><italic>m</italic></sub>(&#x003C3;) &#x02264; 1, one has <inline-formula><mml:math id="M722"><mml:msup><mml:mrow><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mn>1</mml:mn><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup><mml:mo>&#x02264;</mml:mo><mml:msup><mml:mrow><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mn>1</mml:mn><mml:mo>-</mml:mo><mml:msub><mml:mrow><mml:mi>r</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02032;</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mrow><mml:mo stretchy="false">(</mml:mo><mml:mrow><mml:mi>&#x003C3;</mml:mi></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mo stretchy="false">)</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula>. Hence, denoted by <inline-formula><mml:math id="M723"><mml:msub><mml:mrow><mml:mrow><mml:mo>{</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent="false"><mml:mrow><mml:mi>u</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo>}</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> a base of eigenvectors of <inline-formula><mml:math id="M724"><mml:mover accent="false"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>c</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:math></inline-formula>, it holds that</p>
<disp-formula id="E90"><mml:math id="M304"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:mo>=</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>j</mml:mi></mml:munder><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mn>1</mml:mn><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo></mml:mrow></mml:mstyle><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:msup><mml:mrow><mml:mo>&#x02329;</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:msub><mml:mover accent='true'><mml:mi>u</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub></mml:mrow><mml:mo>&#x0232A;</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>&#x02264;</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mi>j</mml:mi></mml:munder><mml:mrow><mml:mo stretchy='false'>(</mml:mo><mml:mn>1</mml:mn><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:msup><mml:mi>m</mml:mi><mml:mo>&#x02032;</mml:mo></mml:msup></mml:msub><mml:mo stretchy='false'>(</mml:mo></mml:mrow></mml:mstyle><mml:msub><mml:mover accent='true'><mml:mi>&#x003C3;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:msup><mml:mo stretchy='false'>)</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:msup><mml:mrow><mml:mo>&#x02329;</mml:mo><mml:mrow><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:msub><mml:mover accent='true'><mml:mi>u</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>j</mml:mi></mml:msub></mml:mrow><mml:mo>&#x0232A;</mml:mo></mml:mrow><mml:mn>2</mml:mn></mml:msup></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;&#x000A0;</mml:mtext><mml:mo>=</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:msup><mml:mi>m</mml:mi><mml:mo>&#x02032;</mml:mo></mml:msup></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:msup><mml:mo>&#x0007C;</mml:mo><mml:mn>2</mml:mn></mml:msup><mml:mo>.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>Hence, for any point in <inline-formula><mml:math id="M725"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>m</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02032;</mml:mi></mml:mrow></mml:msup><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>,</p>
<disp-formula id="E91"><mml:math id="M306"><mml:mtable columnalign='left'><mml:mtr><mml:mtd><mml:mtext>&#x000A0;</mml:mtext><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:mi>m</mml:mi></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:mo>&#x0007C;</mml:mo><mml:msubsup><mml:mo>&#x0007C;</mml:mo><mml:mi>&#x0210B;</mml:mi><mml:mn>2</mml:mn></mml:msubsup></mml:mtd></mml:mtr><mml:mtr><mml:mtd><mml:mtext>&#x02003;&#x02003;</mml:mtext><mml:mo>&#x02264;</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:mo>&#x0007C;</mml:mo><mml:mo>&#x0007C;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>I</mml:mi><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mi>r</mml:mi><mml:msup><mml:mi>m</mml:mi><mml:mo>&#x02032;</mml:mo></mml:msup></mml:msub><mml:mo stretchy='false'>(</mml:mo><mml:mover accent='true'><mml:mrow><mml:msubsup><mml:mi>T</mml:mi><mml:mi>n</mml:mi><mml:mi>c</mml:mi></mml:msubsup></mml:mrow><mml:mo stretchy='true'>&#x0005E;</mml:mo></mml:mover><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>)</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mo>&#x003A6;</mml:mo><mml:mo stretchy='false'>(</mml:mo><mml:mi>x</mml:mi><mml:mo stretchy='false'>)</mml:mo><mml:mo>&#x02212;</mml:mo><mml:msub><mml:mover accent='true'><mml:mi>&#x003BC;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover><mml:mi>n</mml:mi></mml:msub><mml:mo stretchy='false'>)</mml:mo><mml:mtext>&#x000A0;</mml:mtext><mml:mo>&#x0007C;</mml:mo><mml:msubsup><mml:mo>&#x0007C;</mml:mo><mml:mi>&#x0210B;</mml:mi><mml:mn>2</mml:mn></mml:msubsup><mml:mo>&#x02264;</mml:mo><mml:msup><mml:mi>&#x003C4;</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>,</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
<p>so that <inline-formula><mml:math id="M726"><mml:mi>x</mml:mi><mml:mo>&#x02208;</mml:mo><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mi>&#x003C4;</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>.</p>
<p>As above, we illustrate the different choices of <italic>m</italic> with the data sampled from the curve Lis<sub>2,0.11,1,0.3</sub> and the Abel kernel where <italic>n</italic> &#x0003D; 100 and &#x003C4; ranges over 0.25, 0.3, 0.4, 0.5. Figure <xref ref-type="fig" rid="F7">7</xref> shows the nested sets when <italic>m</italic> runs in the associated color-bar.</p>
<fig id="F7" position="float">
<label>Figure 7</label>
<caption><p>From left to right and top to bottom: The family of sets <inline-formula><mml:math id="M727"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:mn>25</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula>,<inline-formula><mml:math id="M728"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:mn>3</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula>,<inline-formula><mml:math id="M729"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:mn>4</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula>,<inline-formula><mml:math id="M730"><mml:msubsup><mml:mrow><mml:mi>&#x00108;</mml:mi></mml:mrow><mml:mrow><mml:mn>100</mml:mn></mml:mrow><mml:mrow><mml:mi>m</mml:mi><mml:mo>,</mml:mo><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:mn>5</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula> with <italic>m</italic> varying as in the related colorbar.</p></caption>
<graphic xlink:href="fams-03-00023-g0007.tif"/>
</fig>
</sec>
<sec sec-type="discussion" id="s6">
<title>6. Discussion</title>
<p>We presented a new class of set estimators, which are able to learn the support of an unknown probability distribution from a training set of random data. The set estimator is defined through a decision function, which can be seen as a novelty/anomality detection algorithm as in Sch&#x000F6;lkopf et al. [<xref ref-type="bibr" rid="B6">6</xref>].</p>
<p>The decision function we defined is a kernel machine. It is computed by the singular value decomposition of the empirical (kernel)-covariance matrix and by a low pass filter. An example of filter is the hard cut-off function and the corresponding decision function reduces to KPCA algorithm for novelty detection first introduced by Hoffmann [<xref ref-type="bibr" rid="B16">16</xref>]. However, we showed that it is possible to choose other low pass filters, as it was done for a class of supervised algorithms in the regression/classification setting [<xref ref-type="bibr" rid="B38">38</xref>].</p>
<p>Under some weak assumptions on the low pass filter, we proved that the corresponding set estimator is strongly consistent with respect to the Hausdorff distance, provided that the kernel satisfies a suitable separating condition, as it happens, for example, for the Abel kernel. Furthermore, by comparing Theorem 2 with a similar consistency result in De Vito et al. [<xref ref-type="bibr" rid="B27">27</xref>], it appears clear that the algorithm correctly learns the support both if the data have zero mean, as in our paper, and if the data are not centered, as in De Vito et al. [<xref ref-type="bibr" rid="B27">27</xref>]. On the contrary, if the separating property does not hold, the algorithm learns only the supports that are mapped into linear subspaces by the feature map defined by the kernel.</p>
<p>The set estimator we introduced depends on two parameters: the <italic>effective</italic> number <italic>m</italic> of eigenvectors defining the decision function and the thickness &#x003C4; of the region estimating the support. The role of these parameters and of the separating property was briefly discussed by a few tests on toy data.</p>
<p>We finally observe that our class of set learning algorithms is very similar to classical kernel machines in supervised learning. So, in order to reduce both the computational cost and the memory requirements, there is the possibility to successfully implement some new advanced approximation techniques, for which there exist theoretical guarantees for the statistical learning setting. For example random features [<xref ref-type="bibr" rid="B39">39</xref>, <xref ref-type="bibr" rid="B40">40</xref>], Nystr&#x000F6;m projections [<xref ref-type="bibr" rid="B41">41</xref>, <xref ref-type="bibr" rid="B42">42</xref>] or mixed approaches with iterative regularization and preconditioning [<xref ref-type="bibr" rid="B43">43</xref>, <xref ref-type="bibr" rid="B44">44</xref>].</p>
</sec>
<sec id="s7">
<title>Author contributions</title>
<p>All authors listed have made a substantial, direct and intellectual contribution to the work, and approved it for publication.</p>
<sec>
<title>Conflict of interest statement</title>
<p>The authors declare that the research was conducted in the absence of any commercial or financial relationships that could be construed as a potential conflict of interest.</p>
</sec>
</sec>
</body>
<back>
<ack><p>ED is member of the Gruppo Nazionale per l&#x00027;Analisi Matematica, la Probabilit&#x000E0; e le loro Applicazioni (GNAMPA) of the Istituto Nazionale di Alta Matematica (INdAM).</p>
</ack>
<sec sec-type="supplementary-material" id="s8">
<title>Supplementary material</title>
<p>The Supplementary Material for this article can be found online at: <ext-link ext-link-type="uri" xlink:href="https://www.frontiersin.org/articles/10.3389/fams.2017.00023/full#supplementary-material">https://www.frontiersin.org/articles/10.3389/fams.2017.00023/full#supplementary-material</ext-link></p>
<supplementary-material xlink:href="DataSheet1.pdf" id="SM1" mimetype="application/pdf" xmlns:xlink="http://www.w3.org/1999/xlink"/>
</sec>
<ref-list>
<title>References</title>
<ref id="B1">
<label>1.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Devroye</surname> <given-names>L</given-names></name> <name><surname>Wise</surname> <given-names>GL</given-names></name></person-group>. <article-title>Detection of abnormal behavior via nonparametric estimation of the support</article-title>. <source>SIAM J Appl Math.</source> (<year>1980</year>) <volume>38</volume>:<fpage>480</fpage>&#x02013;<lpage>8</lpage>. <pub-id pub-id-type="doi">10.1137/0138038</pub-id></citation>
</ref>
<ref id="B2">
<label>2.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Korostel&#x000EB;v</surname> <given-names>AP</given-names></name> <name><surname>Tsybakov</surname> <given-names>AB</given-names></name></person-group>. <source>Minimax Theory of Image Reconstruction</source>. <publisher-loc>New York, NY</publisher-loc>: <publisher-name>Springer-Verlag</publisher-name> (<year>1993</year>).</citation>
</ref>
<ref id="B3">
<label>3.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>D&#x000FC;mbgen</surname> <given-names>L</given-names></name> <name><surname>Walther</surname> <given-names>G</given-names></name></person-group>. <article-title>Rates of convergence for random approximations of convex sets</article-title>. <source>Adv Appl Probab</source>. (<year>1996</year>) <volume>28</volume>:<fpage>384</fpage>&#x02013;<lpage>93</lpage>. <pub-id pub-id-type="doi">10.2307/1428063</pub-id></citation>
</ref>
<ref id="B4">
<label>4.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Cuevas</surname> <given-names>A</given-names></name> <name><surname>Fraiman</surname> <given-names>R</given-names></name></person-group>. <article-title>A plug-in approach to support estimation</article-title>. <source>Ann Stat.</source> (<year>1997</year>) <volume>25</volume>:<fpage>2300</fpage>&#x02013;<lpage>12</lpage>. <pub-id pub-id-type="doi">10.1214/aos/1030741073</pub-id></citation>
</ref>
<ref id="B5">
<label>5.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Tsybakov</surname> <given-names>AB</given-names></name></person-group>. <article-title>On nonparametric estimation of density level sets</article-title>. <source>Ann Stat.</source> (<year>1997</year>) <volume>25</volume>:<fpage>948</fpage>&#x02013;<lpage>69</lpage>. <pub-id pub-id-type="doi">10.1214/aos/1069362732</pub-id></citation>
</ref>
<ref id="B6">
<label>6.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Sch&#x000F6;lkopf</surname> <given-names>B</given-names></name> <name><surname>Platt</surname> <given-names>J</given-names></name> <name><surname>Shawe-Taylor</surname> <given-names>J</given-names></name> <name><surname>Smola</surname> <given-names>A</given-names></name> <name><surname>Williamson</surname> <given-names>R</given-names></name></person-group>. <article-title>Estimating the support of a high-dimensional distribution</article-title>. <source>Neural Comput.</source> (<year>2001</year>) <volume>13</volume>:<fpage>1443</fpage>&#x02013;<lpage>71</lpage>. <pub-id pub-id-type="doi">10.1162/089976601750264965</pub-id></citation>
</ref>
<ref id="B7">
<label>7.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Cuevas</surname> <given-names>A</given-names></name> <name><surname>Rodr&#x000ED;guez-Casal</surname> <given-names>A</given-names></name></person-group>. <article-title>Set estimation: an overview and some recent developments</article-title>. In: <source>Recent Advances and Trends in Nonparametric Statistics</source>. <publisher-name>Elsevier</publisher-name>: <publisher-loc>Amsterdam</publisher-loc> (<year>2003</year>). p. <fpage>251</fpage>&#x02013;<lpage>64</lpage>.</citation>
</ref>
<ref id="B8">
<label>8.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Reitzner</surname> <given-names>M</given-names></name></person-group>. <article-title>Random polytopes and the Efron-Stein jackknife inequality</article-title>. <source>Ann Probab.</source> (<year>2003</year>) <volume>31</volume>:<fpage>2136</fpage>&#x02013;<lpage>66</lpage>. <pub-id pub-id-type="doi">10.1214/aop/1068646381</pub-id></citation>
</ref>
<ref id="B9">
<label>9.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Steinwart</surname> <given-names>I</given-names></name> <name><surname>Hush</surname> <given-names>D</given-names></name> <name><surname>Scovel</surname> <given-names>C</given-names></name></person-group>. <article-title>A classification framework for anomaly detection</article-title>. <source>J Mach Learn Res</source>. (<year>2005</year>) <volume>6</volume>:<fpage>211</fpage>&#x02013;<lpage>32</lpage>.</citation>
</ref>
<ref id="B10">
<label>10.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Vert</surname> <given-names>R</given-names></name> <name><surname>Vert</surname> <given-names>JP</given-names></name></person-group>. <article-title>Consistency and convergence rates of one-class SVMs and related algorithms</article-title>. <source>J Mach Learn Res</source>. (<year>2006</year>) <volume>7</volume>:<fpage>817</fpage>&#x02013;<lpage>54</lpage>.</citation>
</ref>
<ref id="B11">
<label>11.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Scott</surname> <given-names>CD</given-names></name> <name><surname>Nowak</surname> <given-names>RD</given-names></name></person-group>. <article-title>Learning minimum volume sets</article-title>. <source>J Mach Learn Res</source>. (<year>2006</year>) <volume>7</volume>:<fpage>665</fpage>&#x02013;<lpage>704</lpage>.</citation>
</ref>
<ref id="B12">
<label>12.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Biau</surname> <given-names>G</given-names></name> <name><surname>Cadre</surname> <given-names>B</given-names></name> <name><surname>Mason</surname> <given-names>D</given-names></name> <name><surname>Pelletier</surname> <given-names>B</given-names></name></person-group>. <article-title>Asymptotic normality in density support estimation</article-title>. <source>Electron J Probab</source>. (<year>2009</year>) <volume>91</volume>:<fpage>2617</fpage>&#x02013;<lpage>35</lpage>.</citation>
</ref>
<ref id="B13">
<label>13.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Cuevas</surname> <given-names>A</given-names></name> <name><surname>Fraiman</surname> <given-names>R</given-names></name></person-group>. <article-title>Set estimation</article-title>. In: <person-group person-group-type="editor"><name><surname>Kendall</surname> <given-names>W.</given-names></name> <name><surname>Molchanov</surname> <given-names>I.</given-names></name></person-group> editors. <source>New Perspectives in Stochastic Geometry</source>. <publisher-loc>Oxford</publisher-loc>: <publisher-name>Oxford University Press</publisher-name> (<year>2010</year>). p. <fpage>374</fpage>&#x02013;<lpage>97</lpage>.</citation>
</ref>
<ref id="B14">
<label>14.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Bobrowski</surname> <given-names>O</given-names></name> <name><surname>Mukherjee</surname> <given-names>S</given-names></name> <name><surname>Taylor</surname> <given-names>JE</given-names></name></person-group>. <article-title>Topological consistency via kernel estimation</article-title>. <source>Bernoulli</source> (<year>2017</year>) <volume>23</volume>:<fpage>288</fpage>&#x02013;<lpage>328</lpage>. <pub-id pub-id-type="doi">10.3150/15-BEJ744</pub-id></citation>
</ref>
<ref id="B15">
<label>15.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Campos</surname> <given-names>GO</given-names></name> <name><surname>Zimek</surname> <given-names>A</given-names></name> <name><surname>Sander</surname> <given-names>J</given-names></name> <name><surname>Campello</surname> <given-names>RJ</given-names></name> <name><surname>Micenkov&#x000E1;</surname> <given-names>B</given-names></name> <name><surname>Schubert</surname> <given-names>E</given-names></name> <etal/></person-group>. <article-title>On the evaluation of unsupervised outlier detection: measures, datasets, and an empirical study</article-title>. <source>Data Min Knowl Discov</source>. (<year>2016</year>) <volume>30</volume>:<fpage>891</fpage>&#x02013;<lpage>927</lpage>. <pub-id pub-id-type="doi">10.1007/s10618-015-0444-8</pub-id></citation>
</ref>
<ref id="B16">
<label>16.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Hoffmann</surname> <given-names>H</given-names></name></person-group>. <article-title>Kernel PCA for novelty detection</article-title>. <source>Pattern Recognit</source>. (<year>2007</year>) <volume>40</volume>:<fpage>863</fpage>&#x02013;<lpage>74</lpage>. <pub-id pub-id-type="doi">10.1016/j.patcog.2006.07.009</pub-id></citation>
</ref>
<ref id="B17">
<label>17.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Sch&#x000F6;lkopf</surname> <given-names>B</given-names></name> <name><surname>Smola</surname> <given-names>A</given-names></name> <name><surname>M&#x000FC;ller</surname> <given-names>KR</given-names></name></person-group>. <article-title>Nonlinear component analysis as a kernel eigenvalue problem</article-title>. <source>Neural Comput</source>. (<year>1998</year>) <volume>10</volume>:<fpage>1299</fpage>&#x02013;<lpage>319</lpage>.</citation>
</ref>
<ref id="B18">
<label>18.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Ristic</surname> <given-names>B</given-names></name> <name><surname>La Scala</surname> <given-names>B</given-names></name> <name><surname>Morelande</surname> <given-names>M</given-names></name> <name><surname>Gordon</surname> <given-names>N</given-names></name></person-group>. <article-title>Statistical analysis of motion patterns in AIS data: anomaly detection and motion prediction</article-title>. In: <source>2008 11th International Conference on Information Fusion</source> (<year>2008</year>). p. <fpage>1</fpage>&#x02013;<lpage>7</lpage>.</citation>
</ref>
<ref id="B19">
<label>19.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Lee</surname> <given-names>HJ</given-names></name> <name><surname>Cho</surname> <given-names>S</given-names></name> <name><surname>Shin</surname> <given-names>MS</given-names></name></person-group>. <article-title>Supporting diagnosis of attention-deficit hyperactive disorder with novelty detection</article-title>. <source>Artif Intell Med</source>. (<year>2008</year>) <volume>42</volume>:<fpage>199</fpage>&#x02013;<lpage>212</lpage>. <pub-id pub-id-type="doi">10.1016/j.artmed.2007.11.001</pub-id></citation>
</ref>
<ref id="B20">
<label>20.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Valero-Cuevas</surname> <given-names>FJ</given-names></name> <name><surname>Hoffmann</surname> <given-names>H</given-names></name> <name><surname>Kurse</surname> <given-names>MU</given-names></name> <name><surname>Kutch</surname> <given-names>JJ</given-names></name> <name><surname>Theodorou</surname> <given-names>EA</given-names></name></person-group>. <article-title>Computational models for neuromuscular function</article-title>. <source>IEEE Rev Biomed Eng.</source> (<year>2009</year>) <volume>2</volume>:<fpage>110</fpage>&#x02013;<lpage>35</lpage>. <pub-id pub-id-type="doi">10.1109/RBME.2009.2034981</pub-id></citation>
</ref>
<ref id="B21">
<label>21.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>He</surname> <given-names>F</given-names></name> <name><surname>Yang</surname> <given-names>JH</given-names></name> <name><surname>Li</surname> <given-names>M</given-names></name> <name><surname>Xu</surname> <given-names>JW</given-names></name></person-group>. <article-title>Research on nonlinear process monitoring and fault diagnosis based on kernel principal component analysis</article-title>. <source>Key Eng Mater.</source> (<year>2009</year>) <volume>413</volume>:<fpage>583</fpage>&#x02013;<lpage>90</lpage>. <pub-id pub-id-type="doi">10.4028/www.scientific.net/KEM.413-414.583</pub-id></citation>
</ref>
<ref id="B22">
<label>22.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Maestri</surname> <given-names>ML</given-names></name> <name><surname>Cassanello</surname> <given-names>MC</given-names></name> <name><surname>Horowitz</surname> <given-names>GI</given-names></name></person-group>. <article-title>Kernel PCA performance in processes with multiple operation modes</article-title>. <source>Chem Prod Process Model.</source> (<year>2009</year>) <volume>4</volume>:<fpage>1934</fpage>&#x02013;<lpage>2659</lpage>. <pub-id pub-id-type="doi">10.2202/1934-2659.1383</pub-id></citation>
</ref>
<ref id="B23">
<label>23.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Cheng</surname> <given-names>P</given-names></name> <name><surname>Li</surname> <given-names>W</given-names></name> <name><surname>Ogunbona</surname> <given-names>P</given-names></name></person-group>. <article-title>Kernel PCA of HOG features for posture detection</article-title>. In: <source>VCNZ&#x00027;09. 24th International Conference on Image and Vision Computing New Zealand, 2009</source>. <publisher-loc>Wellington</publisher-loc> (<year>2009</year>). p. <fpage>415</fpage>&#x02013;<lpage>20</lpage>.</citation>
</ref>
<ref id="B24">
<label>24.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Sofman</surname> <given-names>B</given-names></name> <name><surname>Bagnell</surname> <given-names>JA</given-names></name> <name><surname>Stentz</surname> <given-names>A</given-names></name></person-group>. <article-title>Anytime online novelty detection for vehicle safeguarding</article-title>. In: <source>2010 IEEE International Conference on Robotics and Automation (ICRA).</source> <publisher-loc>Pittsburgh, PA</publisher-loc> (<year>2010</year>). p. <fpage>1247</fpage>&#x02013;<lpage>54</lpage>.</citation>
</ref>
<ref id="B25">
<label>25.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>De Vito</surname> <given-names>E</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name> <name><surname>Toigo</surname> <given-names>A</given-names></name></person-group>. <article-title>A universally consistent spectral estimator for the support of a distribution</article-title>. <source>Appl Comput Harmonic Anal</source>. (<year>2014</year>) <volume>37</volume>:<fpage>185</fpage>&#x02013;<lpage>217</lpage>. <pub-id pub-id-type="doi">10.1016/j.acha.2013.11.003</pub-id></citation>
</ref>
<ref id="B26">
<label>26.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Steinwart</surname> <given-names>I</given-names></name></person-group>. <article-title>On the influence of the kernel on the consistency of support vector machines</article-title>. <source>J Mach Learn Res.</source> (<year>2002</year>) <volume>2</volume>:<fpage>67</fpage>&#x02013;<lpage>93</lpage>. <pub-id pub-id-type="doi">10.1162/153244302760185252</pub-id></citation>
</ref>
<ref id="B27">
<label>27.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>De Vito</surname> <given-names>E</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name> <name><surname>Toigo</surname> <given-names>A</given-names></name></person-group>. <article-title>Spectral regularization for support estimation</article-title>. In: <source>NIPS</source>. <publisher-loc>Vancouver, BC</publisher-loc> (<year>2010</year>). p. <fpage>1</fpage>&#x02013;<lpage>9</lpage>.</citation>
</ref>
<ref id="B28">
<label>28.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Engl</surname> <given-names>HW</given-names></name> <name><surname>Hanke</surname> <given-names>M</given-names></name> <name><surname>Neubauer</surname> <given-names>A</given-names></name></person-group>. <source>Regularization of Inverse Problems. Vol. 375 of Mathematics and its Applications.</source> <publisher-loc>Dordrecht</publisher-loc>: <publisher-name>Kluwer Academic Publishers Group</publisher-name> (<year>1996</year>).</citation>
</ref>
<ref id="B29">
<label>29.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Lo Gerfo</surname> <given-names>L</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name> <name><surname>Odone</surname> <given-names>F</given-names></name> <name><surname>De Vito</surname> <given-names>E</given-names></name> <name><surname>Verri</surname> <given-names>A</given-names></name></person-group>. <article-title>Spectral algorithms for supervised learning</article-title>. <source>Neural Comput.</source> (<year>2008</year>) <volume>20</volume>:<fpage>1873</fpage>&#x02013;<lpage>97</lpage>. <pub-id pub-id-type="doi">10.1162/neco.2008.05-07-517</pub-id></citation>
</ref>
<ref id="B30">
<label>30.</label>
<citation citation-type="web"><person-group person-group-type="author"><name><surname>Blanchard</surname> <given-names>G</given-names></name> <name><surname>M&#x000FC;cke</surname> <given-names>N</given-names></name></person-group>. <article-title>Optimal rates for regularization of statistical inverse learning problems</article-title>. In: <source>Foundations of Computational Mathematics</source>. (<year>2017</year>). Available online at: <ext-link ext-link-type="uri" xlink:href="https://arxiv.org/abs/1604.04054">https://arxiv.org/abs/1604.04054</ext-link></citation>
</ref>
<ref id="B31">
<label>31.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Rudi</surname> <given-names>A</given-names></name> <name><surname>Odone</surname> <given-names>F</given-names></name> <name><surname>De Vito</surname> <given-names>E</given-names></name></person-group>. <article-title>Geometrical and computational aspects of Spectral Support Estimation for novelty detection</article-title>. <source>Pattern Recognit Lett</source>. (<year>2014</year>) <volume>36</volume>:<fpage>107</fpage>&#x02013;<lpage>16</lpage>. <pub-id pub-id-type="doi">10.1016/j.patrec.2013.09.025</pub-id></citation>
</ref>
<ref id="B32">
<label>32.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Rudi</surname> <given-names>A</given-names></name> <name><surname>Canas</surname> <given-names>GD</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name></person-group>. <article-title>On the sample complexity of subspace learning</article-title>. In: <person-group person-group-type="editor"><name><surname>Burges</surname> <given-names>CJC</given-names></name> <name><surname>Bottou</surname> <given-names>L</given-names></name> <name><surname>Welling</surname> <given-names>M</given-names></name> <name><surname>Ghahramani</surname> <given-names>Z</given-names></name> <name><surname>Weinberger</surname> <given-names>KQ</given-names></name></person-group> editors. <source>Advances in Neural Information Processing Systems</source>. <publisher-loc>Lake Tahoe</publisher-loc>: <publisher-name>Neural Information Processing Systems Conference</publisher-name> (<year>2013</year>). p. <fpage>2067</fpage>&#x02013;<lpage>75</lpage>.</citation>
</ref>
<ref id="B33">
<label>33.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Rudi</surname> <given-names>A</given-names></name> <name><surname>Canas</surname> <given-names>GD</given-names></name> <name><surname>De Vito</surname> <given-names>E</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name></person-group>. <article-title>Learning Sets and Subspaces</article-title>. In: <person-group person-group-type="editor"><name><surname>Suykens</surname> <given-names>JAK</given-names></name> <name><surname>Signoretto</surname> <given-names>M</given-names></name> <name><surname>Argyriou</surname> <given-names>A</given-names></name></person-group> editors. <source>Regularization, Optimization, Kernels, and Support Vector Machines</source>. <publisher-loc>Boca Raton, FL</publisher-loc>: <publisher-name>Chapman and Hall/CRC</publisher-name> (<year>2014</year>). p. <fpage>337</fpage>.</citation>
</ref>
<ref id="B34">
<label>34.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Blanchard</surname> <given-names>G</given-names></name> <name><surname>Bousquet</surname> <given-names>O</given-names></name> <name><surname>Zwald</surname> <given-names>L</given-names></name></person-group>. <article-title>Statistical properties of kernel principal component analysis</article-title>. <source>Machine Learn</source>. (<year>2007</year>) <volume>66</volume>:<fpage>259</fpage>&#x02013;<lpage>94</lpage>. <pub-id pub-id-type="doi">10.1007/s10994-006-8886-2</pub-id></citation>
</ref>
<ref id="B35">
<label>35.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Gy&#x000F6;rfi</surname> <given-names>L</given-names></name> <name><surname>Kohler</surname> <given-names>M</given-names></name> <name><surname>Krzy zak</surname> <given-names>A</given-names></name> <name><surname>Walk</surname> <given-names>H</given-names></name></person-group>. <source>A Distribution-Free Theory of Nonparametric Regression</source>. <publisher-name>Springer</publisher-name> Series in Statistics. <publisher-loc>New York, NY</publisher-loc>: <publisher-name>Springer-Verlag</publisher-name> (<year>2002</year>).</citation>
</ref>
<ref id="B36">
<label>36.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Steinwart</surname> <given-names>I</given-names></name> <name><surname>Christmann</surname> <given-names>A</given-names></name></person-group>. <article-title>Support Vector Machines. Information Science and Statistics</article-title>. <publisher-loc>New York, NY</publisher-loc>: <publisher-name>Springer</publisher-name> (<year>2008</year>).</citation>
</ref>
<ref id="B37">
<label>37.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Zwald</surname> <given-names>L</given-names></name> <name><surname>Blanchard</surname> <given-names>G</given-names></name></person-group>. <article-title>On the Convergence of eigenspaces in kernel principal component analysis</article-title>. In: <person-group person-group-type="editor"><name><surname>Weiss</surname> <given-names>Y</given-names></name> <name><surname>Sch&#x000F6;lkopf</surname> <given-names>B</given-names></name> <name><surname>Platt</surname> <given-names>J</given-names></name></person-group> editors. <source>Advances in Neural Information Processing Systems 18</source>. <publisher-loc>Cambridge, MA</publisher-loc>: <publisher-name>MIT Press</publisher-name> (<year>2006</year>). p. <fpage>1649</fpage>&#x02013;<lpage>56</lpage>.</citation>
</ref>
<ref id="B38">
<label>38.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>De Vito</surname> <given-names>E</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name> <name><surname>Caponnetto</surname> <given-names>A</given-names></name> <name><surname>De Giovannini</surname> <given-names>U</given-names></name> <name><surname>Odone</surname> <given-names>F</given-names></name></person-group>. <article-title>Learning from examples as an inverse problem</article-title>. <source>J Machine Learn Res</source>. (<year>2005</year>) <volume>6</volume>:<fpage>883</fpage>&#x02013;<lpage>904</lpage>.</citation>
</ref>
<ref id="B39">
<label>39.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Rahimi</surname> <given-names>A</given-names></name> <name><surname>Recht</surname> <given-names>B</given-names></name></person-group>. <article-title>Random features for large-scale kernel machines</article-title>. In: <person-group person-group-type="editor"><name><surname>Koller</surname> <given-names>D</given-names></name> <name><surname>Schuurmans</surname> <given-names>D</given-names></name> <name><surname>Bengio</surname> <given-names>Y</given-names></name> <name><surname>Bottou</surname> <given-names>L</given-names></name></person-group> editors. <source>Advances in Neural Information Processing Systems</source>. <publisher-loc>Vancouver, BC</publisher-loc>: <publisher-name>Neural Information Processing Systems Conference</publisher-name> (<year>2008</year>). p. <fpage>1177</fpage>&#x02013;<lpage>84</lpage>.</citation>
</ref>
<ref id="B40">
<label>40.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Rudi</surname> <given-names>A</given-names></name> <name><surname>Camoriano</surname> <given-names>R</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name></person-group>. <article-title>Generalization properties of learning with random features</article-title>. <source>arXiv preprint arXiv:160204474</source> (<year>2016</year>).</citation>
</ref>
<ref id="B41">
<label>41.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Smola</surname> <given-names>AJ</given-names></name> <name><surname>Sch&#x000F6;lkopf</surname> <given-names>B</given-names></name></person-group>. <article-title>Sparse greedy matrix approximation for machine learning</article-title>. In: <source>Proceeding ICML &#x00027;00 Proceedings of the Seventeenth International Conference on Machine Learning</source>. <publisher-loc>Stanford, CA</publisher-loc>: <publisher-name>Morgan Kaufmann</publisher-name> (<year>2000</year>). p. <fpage>911</fpage>&#x02013;<lpage>18</lpage>.</citation>
</ref>
<ref id="B42">
<label>42.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Rudi</surname> <given-names>A</given-names></name> <name><surname>Camoriano</surname> <given-names>R</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name></person-group>. <article-title>Less is more: nystr&#x000F6;m computational regularization</article-title>. In: <person-group person-group-type="editor"><name><surname>Cortes</surname> <given-names>C</given-names></name> <name><surname>Lawrence</surname> <given-names>ND</given-names></name> <name><surname>Lee</surname> <given-names>DD</given-names></name> <name><surname>Sugiyama</surname> <given-names>M</given-names></name> <name><surname>Garnett</surname> <given-names>R</given-names></name></person-group> editors. <source>Advances in Neural Information Processing Systems</source>. <publisher-loc>Montreal, QC</publisher-loc>: <publisher-name>Neural Information Processing Systems Conference</publisher-name> (<year>2015</year>). p. <fpage>1657</fpage>&#x02013;<lpage>1665</lpage>.</citation>
</ref>
<ref id="B43">
<label>43.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Camoriano</surname> <given-names>R</given-names></name> <name><surname>Angles</surname> <given-names>T</given-names></name> <name><surname>Rudi</surname> <given-names>A</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name></person-group>. <article-title>NYTRO: when subsampling meets early stopping</article-title>. In: <person-group person-group-type="editor"><name><surname>Gretton</surname> <given-names>A</given-names></name> <name><surname>Robert</surname> <given-names>CC</given-names></name></person-group> editors. <source>Artificial Intelligence and Statistics</source>. <publisher-loc>Cadiz</publisher-loc>: <publisher-name>Proceedings of Machine Learning Research</publisher-name> (<year>2016</year>). p. <fpage>1403</fpage>&#x02013;<lpage>11</lpage>.</citation>
</ref>
<ref id="B44">
<label>44.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Rudi</surname> <given-names>A</given-names></name> <name><surname>Carratino</surname> <given-names>L</given-names></name> <name><surname>Rosasco</surname> <given-names>L</given-names></name></person-group>. <article-title>FALKON: an optimal large scale Kernel method</article-title>. <source>arXiv preprint arXiv:170510958</source> (<year>2017</year>).</citation>
</ref>
<ref id="B45">
<label>45.</label>
<citation citation-type="book"><person-group person-group-type="author"><name><surname>Folland</surname> <given-names>G</given-names></name></person-group>. <source>A Course in Abstract Harmonic Analysis. Studies in Advanced Mathematics</source>. <publisher-loc>Boca Raton, FL</publisher-loc>: <publisher-name>CRC Press</publisher-name> (<year>1995</year>).</citation>
</ref>
<ref id="B46">
<label>46.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>Birman</surname> <given-names>MS</given-names></name> <name><surname>Solomyak</surname> <given-names>M</given-names></name></person-group>. <article-title>Double operator integrals in a Hilbert space</article-title>. <source>Integr Equat Oper Theor</source>. (<year>2003</year>) <volume>47</volume>:<fpage>131</fpage>&#x02013;<lpage>68</lpage>. <pub-id pub-id-type="doi">10.1007/s00020-003-1157-8</pub-id></citation>
</ref>
<ref id="B47">
<label>47.</label>
<citation citation-type="journal"><person-group person-group-type="author"><name><surname>De Vito</surname> <given-names>E</given-names></name> <name><surname>Umanit&#x000E0;</surname> <given-names>V</given-names></name> <name><surname>Villa</surname> <given-names>S</given-names></name></person-group>. <article-title>A consistent algorithm to solve Lasso, elastic-net and Tikhonov regularization</article-title>. <source>J Complex</source>. (<year>2011</year>) <volume>27</volume>:<fpage>188</fpage>&#x02013;<lpage>200</lpage>. <pub-id pub-id-type="doi">10.1016/j.jco.2011.01.003</pub-id></citation>
</ref>
</ref-list>
<fn-group>
<fn id="fn0001"><p><sup>1</sup>Here, the labeling is different from the one in (6), where the eigenvalues are repeated according to their multiplicity.</p></fn>
</fn-group>
</back>
</article>
