统计操作示例 (Statistics Examples)

概述 / Overview

本文档按从简到繁介绍 Stats 工厂与各分布、检验等用法；向量数据推荐用 Linalg.vector(...) 得到 IVector<Double>，再与统计模块配合。

This document introduces the Stats factory and distributions/tests in order of complexity. Use Linalg.vector(...) for IVector<Double> data alongside statistics APIs.

第一部分：入门基础 (Level 1 - 基础入门) / Part 1: Beginner Level (Level 1 - Basic Introduction)

1.1 基本概念 / Environment Setup and Basic Concepts

基本统计量计算 / Basic Statistics on Vectors

import com.yishape.lab.math.linalg.IVector;
import com.yishape.lab.math.linalg.Linalg;
import java.util.Arrays;

public class BasicStatisticsExample {
    public static void main(String[] args) {
        // 创建示例数据 / Create sample data
        double[] data = {1.2, 2.3, 1.8, 3.1, 2.7, 1.5, 2.9, 3.2, 2.1, 2.8};
        IVector<Double> vector = Linalg.vector(data);
        
        // 计算基本统计量 / Calculate basic statistics
        System.out.println("=== 基本统计量 / Basic statistics ===");
        System.out.println("数据: " + Arrays.toString(data) + " / Data: " + Arrays.toString(data));
        System.out.println("均值: " + vector.mean() + " / Mean: " + vector.mean());
        System.out.println("中位数: " + vector.median() + " / Median: " + vector.median());
        System.out.println("标准差: " + vector.std() + " / Standard deviation: " + vector.std());
        System.out.println("方差: " + vector.var() + " / Variance: " + vector.var());
        System.out.println("最小值: " + vector.min() + " / Minimum: " + vector.min());
        System.out.println("最大值: " + vector.max() + " / Maximum: " + vector.max());
        System.out.println("数据个数: " + vector.length() + " / Count: " + vector.length());
    }
}

1.2 正态分布基础 / Normal Distribution Basics

import com.yishape.lab.math.stats.Stats;
import com.yishape.lab.math.stats.distribution.NormalDistribution;

public class NormalDistributionBasicExample {
    public static void main(String[] args) {
        // 创建标准正态分布（均值为0，标准差为1） / Create standard normal distribution (mean=0, std=1)
        NormalDistribution standardNormal = Stats.norm();
        System.out.println("标准正态分布: " + standardNormal + " / Standard normal distribution: " + standardNormal);
        
        // 基本统计量 / Basic statistics
        System.out.println("均值: " + standardNormal.mean() + " / Mean: " + standardNormal.mean());
        System.out.println("标准差: " + standardNormal.std() + " / Standard deviation: " + standardNormal.std());
        System.out.println("方差: " + standardNormal.var() + " / Variance: " + standardNormal.var());
        
        // 概率密度函数 / Probability density function
        System.out.println("\n概率密度函数值: / Probability density function values:");
        float[] xValues = {-2.0f, -1.0f, 0.0f, 1.0f, 2.0f};
        for (float x : xValues) {
            System.out.printf("PDF(%.1f) = %.4f%n", x, standardNormal.pdf(x));
        }
        
        // 累积分布函数 / Cumulative distribution function
        System.out.println("\n累积分布函数值: / Cumulative distribution function values:");
        for (float x : xValues) {
            System.out.printf("CDF(%.1f) = %.4f%n", x, standardNormal.cdf(x));
        }
    }
}

1.3 均匀分布基础 / Uniform Distribution Basics

import com.yishape.lab.math.stats.Stats;
import com.yishape.lab.math.stats.distribution.UniformDistribution;

public class UniformDistributionBasicExample {
    public static void main(String[] args) {
        // 创建均匀分布 [0, 1] / Create uniform distribution [0, 1]
        UniformDistribution uniform = Stats.uniform(0.0, 1.0);
        System.out.println("均匀分布[0,1]: " + uniform + " / Uniform distribution [0,1]: " + uniform);
        
        // 基本统计量 / Basic statistics
        System.out.println("均值: " + uniform.mean() + " / Mean: " + uniform.mean());
        System.out.println("标准差: " + uniform.std() + " / Standard deviation: " + uniform.std());
        System.out.println("方差: " + uniform.var() + " / Variance: " + uniform.var());
        
        // 概率计算 / Probability calculation
        System.out.println("\n概率计算: / Probability calculation:");
        System.out.println("P(X ≤ 0.5) = " + uniform.cdf(0.5f));
        System.out.println("P(0.3 ≤ X ≤ 0.7) = " + (uniform.cdf(0.7f) - uniform.cdf(0.3f)));
        
        // 分位数 / Quantiles
        System.out.println("\n分位数: / Quantiles:");
        System.out.println("50%分位数: " + uniform.ppf(0.5f) + " / 50th percentile: " + uniform.ppf(0.5f));
        System.out.println("90%分位数: " + uniform.ppf(0.9f) + " / 90th percentile: " + uniform.ppf(0.9f));
    }
}

第二部分：基础应用 (Level 2 - 基础应用) / Part 2: Basic Applications (Level 2 - Basic Applications)

2.1 正态分布应用 / Normal Distribution Applications

public class NormalDistributionApplicationExample {
    public static void main(String[] args) {
        // 创建自定义正态分布（均值=10，标准差=2） / Create custom normal distribution (mean=10, std=2)
        NormalDistribution normal = Stats.norm(10.0f, 2.0f);
        System.out.println("正态分布(μ=10, σ=2): " + normal + " / Normal distribution (μ=10, σ=2): " + normal);
        
        // 基本统计量 / Basic statistics
        System.out.println("均值: " + normal.mean() + " / Mean: " + normal.mean());
        System.out.println("标准差: " + normal.std() + " / Standard deviation: " + normal.std());
        System.out.println("方差: " + normal.var() + " / Variance: " + normal.var());
        
        // 概率计算 / Probability calculation
        System.out.println("\n概率计算: / Probability calculation:");
        System.out.println("P(X ≤ 12) = " + normal.cdf(12.0f));
        System.out.println("P(X > 8) = " + normal.sf(8.0f));
        System.out.println("P(8 ≤ X ≤ 12) = " + (normal.cdf(12.0f) - normal.cdf(8.0f)));
        
        // 分位数计算 / Quantile calculation
        System.out.println("\n分位数: / Quantiles:");
        float[] probabilities = {0.01f, 0.05f, 0.1f, 0.25f, 0.5f, 0.75f, 0.9f, 0.95f, 0.99f};
        for (float p : probabilities) {
            System.out.printf("P=%.2f, 分位数=%.4f%n", p, normal.ppf(p));
        }
    }
}

2.2 随机采样基础 / Random Sampling Basics

public class RandomSamplingBasicExample {
    public static void main(String[] args) {
        // 正态分布采样 / Normal distribution sampling
        NormalDistribution normal = Stats.norm(5.0f, 2.0f);
        
        // 生成单个随机样本 / Generate single random sample
        float sample = normal.sample();
        System.out.println("单个随机样本: " + sample + " / Single random sample: " + sample);
        
        // 生成多个随机样本 / Generate multiple random samples
        float[] samples = normal.sample(1000);
        System.out.println("生成了 " + samples.length + " 个随机样本 / Generated " + samples.length + " random samples");
        
        // 计算样本统计量 / Calculate sample statistics
        IVector sampleVector = Linalg.vector(samples);
        System.out.println("\n样本统计量: / Sample statistics:");
        System.out.printf("样本均值: %.4f (理论值: %.4f) / Sample mean: %.4f (theoretical: %.4f)%n", sampleVector.mean(), normal.mean(), sampleVector.mean(), normal.mean());
        System.out.printf("样本标准差: %.4f (理论值: %.4f) / Sample std: %.4f (theoretical: %.4f)%n", sampleVector.std(), normal.std(), sampleVector.std(), normal.std());
        System.out.printf("样本方差: %.4f (理论值: %.4f) / Sample variance: %.4f (theoretical: %.4f)%n", sampleVector.var(), normal.var(), sampleVector.var(), normal.var());
    }
}

2.3 指数分布基础 / Exponential Distribution Basics

public class ExponentialDistributionBasicExample {
    public static void main(String[] args) {
        // 创建指数分布（λ = 0.5） / Create exponential distribution (λ = 0.5)
        ExponentialDistribution exp = Stats.exponential(0.5f);
        System.out.println("指数分布(λ=0.5): " + exp + " / Exponential distribution (λ=0.5): " + exp);
        
        // 基本统计量 / Basic statistics
        System.out.println("均值: " + exp.mean() + " / Mean: " + exp.mean());
        System.out.println("标准差: " + exp.std() + " / Standard deviation: " + exp.std());
        System.out.println("方差: " + exp.var() + " / Variance: " + exp.var());
        
        // 概率计算 / Probability calculation
        System.out.println("\n概率计算: / Probability calculation:");
        float[] times = {1.0f, 2.0f, 3.0f, 5.0f, 10.0f};
        for (float t : times) {
            System.out.printf("P(X ≤ %.1f) = %.4f%n", t, exp.cdf(t));
            System.out.printf("P(X > %.1f) = %.4f%n", t, exp.sf(t));
        }
        
        // 生存函数（可靠性分析） / Survival function (reliability analysis)
        System.out.println("\n生存函数（设备可靠性）: / Survival function (equipment reliability):");
        for (float t : times) {
            System.out.printf("R(%.1f) = P(寿命 > %.1f) = %.4f%n", t, t, exp.sf(t));
        }
    }
}

第三部分：中级应用 (Level 3 - 中级应用) / Part 3: Intermediate Applications (Level 3 - Intermediate Applications)

3.1 t分布应用 / t-Distribution Applications

public class TDistributionApplicationExample {
    public static void main(String[] args) {
        // 创建不同自由度的t分布 / Create t-distributions with different degrees of freedom
        StudentDistribution t5 = Stats.t(5.0f);
        StudentDistribution t10 = Stats.t(10.0f);
        StudentDistribution t30 = Stats.t(30.0f);
        
        System.out.println("=== t分布比较 / t-Distribution Comparison ===");
        System.out.println("t分布(5自由度): " + t5 + " / t-distribution (5 df): " + t5);
        System.out.println("t分布(10自由度): " + t10 + " / t-distribution (10 df): " + t10);
        System.out.println("t分布(30自由度): " + t30 + " / t-distribution (30 df): " + t30);
        
        // 统计量比较 / Statsistics comparison
        System.out.println("\n统计量比较: / Statsistics comparison:");
        System.out.printf("自由度5 - 均值: %.4f, 标准差: %.4f / df=5 - Mean: %.4f, Std: %.4f%n", t5.mean(), t5.std(), t5.mean(), t5.std());
        System.out.printf("自由度10 - 均值: %.4f, 标准差: %.4f / df=10 - Mean: %.4f, Std: %.4f%n", t10.mean(), t10.std(), t10.mean(), t10.std());
        System.out.printf("自由度30 - 均值: %.4f, 标准差: %.4f / df=30 - Mean: %.4f, Std: %.4f%n", t30.mean(), t30.std(), t30.mean(), t30.std());
        
        // 临界值计算（用于假设检验） / Critical value calculation (for hypothesis testing)
        System.out.println("\n临界值计算（95%置信水平）: / Critical value calculation (95% confidence level):");
        float alpha = 0.05f;
        System.out.printf("t(5)临界值: %.4f / t(5) critical value: %.4f%n", t5.ppf(1.0f - alpha/2.0f), t5.ppf(1.0f - alpha/2.0f));
        System.out.printf("t(10)临界值: %.4f / t(10) critical value: %.4f%n", t10.ppf(1.0f - alpha/2.0f), t10.ppf(1.0f - alpha/2.0f));
        System.out.printf("t(30)临界值: %.4f / t(30) critical value: %.4f%n", t30.ppf(1.0f - alpha/2.0f), t30.ppf(1.0f - alpha/2.0f));
    }
}

3.2 卡方分布应用 / Chi-Squared Distribution Applications

public class ChiSquaredDistributionApplicationExample {
    public static void main(String[] args) {
        // 创建不同自由度的卡方分布 / Create chi-squared distributions with different degrees of freedom
        Chi2Distribution chi2_1 = Stats.chi2(1.0f);
        Chi2Distribution chi2_5 = Stats.chi2(5.0f);
        Chi2Distribution chi2_10 = Stats.chi2(10.0f);
        
        System.out.println("=== 卡方分布比较 / Chi-Squared Distribution Comparison ===");
        System.out.println("卡方分布(1自由度): " + chi2_1 + " / Chi-squared distribution (1 df): " + chi2_1);
        System.out.println("卡方分布(5自由度): " + chi2_5 + " / Chi-squared distribution (5 df): " + chi2_5);
        System.out.println("卡方分布(10自由度): " + chi2_10 + " / Chi-squared distribution (10 df): " + chi2_10);
        
        // 统计量比较 / Statsistics comparison
        System.out.println("\n统计量比较: / Statsistics comparison:");
        System.out.printf("自由度1 - 均值: %.4f, 标准差: %.4f / df=1 - Mean: %.4f, Std: %.4f%n", chi2_1.mean(), chi2_1.std(), chi2_1.mean(), chi2_1.std());
        System.out.printf("自由度5 - 均值: %.4f, 标准差: %.4f / df=5 - Mean: %.4f, Std: %.4f%n", chi2_5.mean(), chi2_5.std(), chi2_5.mean(), chi2_5.std());
        System.out.printf("自由度10 - 均值: %.4f, 标准差: %.4f / df=10 - Mean: %.4f, Std: %.4f%n", chi2_10.mean(), chi2_10.std(), chi2_10.mean(), chi2_10.std());
        
        // 临界值计算 / Critical value calculation
        System.out.println("\n临界值计算（95%置信水平）: / Critical value calculation (95% confidence level):");
        float alpha = 0.05f;
        System.out.printf("χ²(1)临界值: %.4f / χ²(1) critical value: %.4f%n", chi2_1.ppf(1.0f - alpha), chi2_1.ppf(1.0f - alpha));
        System.out.printf("χ²(5)临界值: %.4f / χ²(5) critical value: %.4f%n", chi2_5.ppf(1.0f - alpha), chi2_5.ppf(1.0f - alpha));
        System.out.printf("χ²(10)临界值: %.4f / χ²(10) critical value: %.4f%n", chi2_10.ppf(1.0f - alpha), chi2_10.ppf(1.0f - alpha));
    }
}

3.3 F分布应用 / F-Distribution Applications

public class FDistributionApplicationExample {
    public static void main(String[] args) {
        // 创建不同自由度的F分布 / Create F-distributions with different degrees of freedom
        FDistribution f1 = Stats.f(5.0f, 10.0f);
        FDistribution f2 = Stats.f(10.0f, 5.0f);
        FDistribution f3 = Stats.f(20.0f, 20.0f);
        
        System.out.println("=== F分布比较 / F-Distribution Comparison ===");
        System.out.println("F分布(5,10自由度): " + f1 + " / F-distribution (5,10 df): " + f1);
        System.out.println("F分布(10,5自由度): " + f2 + " / F-distribution (10,5 df): " + f2);
        System.out.println("F分布(20,20自由度): " + f3 + " / F-distribution (20,20 df): " + f3);
        
        // 统计量比较 / Statsistics comparison
        System.out.println("\n统计量比较: / Statsistics comparison:");
        System.out.printf("F(5,10) - 均值: %.4f / F(5,10) - Mean: %.4f%n", f1.mean(), f1.mean());
        System.out.printf("F(10,5) - 均值: %.4f / F(10,5) - Mean: %.4f%n", f2.mean(), f2.mean());
        System.out.printf("F(20,20) - 均值: %.4f / F(20,20) - Mean: %.4f%n", f3.mean(), f3.mean());
        
        // 临界值计算 / Critical value calculation
        System.out.println("\n临界值计算（95%置信水平）: / Critical value calculation (95% confidence level):");
        float alpha = 0.05f;
        System.out.printf("F(5,10)临界值: %.4f / F(5,10) critical value: %.4f%n", f1.ppf(1.0f - alpha), f1.ppf(1.0f - alpha));
        System.out.printf("F(10,5)临界值: %.4f / F(10,5) critical value: %.4f%n", f2.ppf(1.0f - alpha), f2.ppf(1.0f - alpha));
        System.out.printf("F(20,20)临界值: %.4f / F(20,20) critical value: %.4f%n", f3.ppf(1.0f - alpha), f3.ppf(1.0f - alpha));
    }
}

3.4 泊松分布应用 / Poisson Distribution Applications

public class PoissonDistributionApplicationExample {
    public static void main(String[] args) {
        // 创建泊松分布（λ = 3） / Create Poisson distribution (λ = 3)
        PoissonDistribution poisson = Stats.poisson(3.0f);
        System.out.println("泊松分布(λ=3): " + poisson + " / Poisson distribution (λ=3): " + poisson);
        
        // 基本统计量 / Basic statistics
        System.out.println("均值: " + poisson.mean() + " / Mean: " + poisson.mean());
        System.out.println("方差: " + poisson.var() + " / Variance: " + poisson.var());
        System.out.println("标准差: " + poisson.std() + " / Standard deviation: " + poisson.std());
        
        // 概率质量函数 / Probability mass function
        System.out.println("\n概率质量函数: / Probability mass function:");
        for (int k = 0; k <= 10; k++) {
            System.out.printf("P(X = %d) = %.4f%n", k, poisson.pmf(k));
        }
        
        // 累积分布函数 / Cumulative distribution function
        System.out.println("\n累积分布函数: / Cumulative distribution function:");
        for (int k = 0; k <= 10; k++) {
            System.out.printf("P(X ≤ %d) = %.4f%n", k, poisson.cdf(k));
        }
        
        // 随机采样 / Random sampling
        System.out.println("\n随机采样: / Random sampling:");
        int[] samples = new int[1000];
        for (int i = 0; i < 1000; i++) {
            samples[i] = (int) poisson.sample();
        }
        
        // 计算样本统计量 / Calculate sample statistics
        float sampleMean = 0;
        for (int sample : samples) {
            sampleMean += sample;
        }
        sampleMean /= samples.length;
        
        System.out.printf("样本均值: %.4f (理论值: %.4f) / Sample mean: %.4f (theoretical: %.4f)%n", sampleMean, poisson.mean(), sampleMean, poisson.mean());
    }
}

第四部分：高级应用 (Level 4 - 高级应用) / Part 4: Advanced Applications (Level 4 - Advanced Applications)

4.1 参数估计 / Parameter Estimation

public class ParameterEstimationExample {
    public static void main(String[] args) {
        // 生成样本数据 / Generate sample data
        NormalDistribution trueDist = Stats.norm(10.0f, 2.0f);
        float[] samples = trueDist.sample(100);
        IVector sampleVector = Linalg.vector(samples);
        
        System.out.println("=== 参数估计示例 / Parameter Estimation Example ===");
        System.out.println("真实参数: μ=10.0, σ=2.0 / True parameters: μ=10.0, σ=2.0");
        System.out.println("样本大小: " + sampleVector.length() + " / Sample size: " + sampleVector.length());
        System.out.println("样本均值: " + sampleVector.mean() + " / Sample mean: " + sampleVector.mean());
        System.out.println("样本标准差: " + sampleVector.std() + " / Sample standard deviation: " + sampleVector.std());
        
        // 参数估计 / Parameter estimation
        ParameterEstimation estimator = new ParameterEstimation();
        
        // 均值置信区间估计（使用t分布） / Mean confidence interval estimation (using t-distribution)
        Tuple2<Float, Float> meanCI = estimator.estimateMeanIntevalWithT(sampleVector, 0.95f);
        System.out.println("\n均值95%置信区间: [" + meanCI._1 + ", " + meanCI._2 + "] / Mean 95% confidence interval: [" + meanCI._1 + ", " + meanCI._2 + "]");
        
        // 方差置信区间估计（使用卡方分布） / Variance confidence interval estimation (using chi-squared distribution)
        Tuple2<Float, Float> varCI = estimator.estimateVarIntevalWithChi2(sampleVector, 0.95f);
        System.out.println("方差95%置信区间: [" + varCI._1 + ", " + varCI._2 + "] / Variance 95% confidence interval: [" + varCI._1 + ", " + varCI._2 + "]");
        
        // 检查真实参数是否在置信区间内 / Check if true parameters are within confidence intervals
        System.out.println("\n参数检验: / Parameter validation:");
        System.out.println("真实均值在置信区间内: " + (meanCI._1 <= 10.0f && 10.0f <= meanCI._2) + " / True mean in confidence interval: " + (meanCI._1 <= 10.0f && 10.0f <= meanCI._2));
        System.out.println("真实方差在置信区间内: " + (varCI._1 <= 4.0f && 4.0f <= varCI._2) + " / True variance in confidence interval: " + (varCI._1 <= 4.0f && 4.0f <= varCI._2));
    }
}

4.2 假设检验 / Hypothesis Testing

public class HypothesisTestingExample {
    public static void main(String[] args) {
        // 生成样本数据 / Generate sample data
        NormalDistribution trueDist = Stats.norm(10.0f, 2.0f);
        float[] samples = trueDist.sample(50);
        IVector sampleVector = Linalg.vector(samples);
        
        System.out.println("=== 假设检验示例 / Hypothesis Testing Example ===");
        System.out.println("样本数据: / Sample data:");
        System.out.println("  样本均值: " + sampleVector.mean() + " / Sample mean: " + sampleVector.mean());
        System.out.println("  样本标准差: " + sampleVector.std() + " / Sample standard deviation: " + sampleVector.std());
        
        // 假设检验 / Hypothesis testing
        HypothesisTesting tester = new HypothesisTesting();
        
        // 检验均值是否等于10.0 / Test if mean equals 10.0
        TestingResult meanTest = tester.testMeanEqualWithT(10.0f, sampleVector, 0.95f);
        System.out.println("\n均值检验 (H0: μ = 10.0): / Mean test (H0: μ = 10.0):");
        System.out.println("  检验结果: " + (meanTest.pass ? "接受原假设" : "拒绝原假设") + " / Test result: " + (meanTest.pass ? "Accept null hypothesis" : "Reject null hypothesis"));
        System.out.println("  p值: " + meanTest.p + " / p-value: " + meanTest.p);
        System.out.println("  置信区间: [" + meanTest.criticalInteval._1 + ", " + meanTest.criticalInteval._2 + "] / Confidence interval: [" + meanTest.criticalInteval._1 + ", " + meanTest.criticalInteval._2 + "]");
        
        // 检验方差是否等于4.0 / Test if variance equals 4.0
        TestingResult varTest = tester.testVarEqualWithChi2(4.0f, sampleVector, 0.95f);
        System.out.println("\n方差检验 (H0: σ² = 4.0): / Variance test (H0: σ² = 4.0):");
        System.out.println("  检验结果: " + (varTest.pass ? "接受原假设" : "拒绝原假设") + " / Test result: " + (varTest.pass ? "Accept null hypothesis" : "Reject null hypothesis"));
        System.out.println("  p值: " + varTest.p + " / p-value: " + varTest.p);
        System.out.println("  置信区间: [" + varTest.criticalInteval._1 + ", " + varTest.criticalInteval._2 + "] / Confidence interval: [" + varTest.criticalInteval._1 + ", " + varTest.criticalInteval._2 + "]");
    }
}

4.3 二项分布应用 / Binomial Distribution Applications

public class BinomialDistributionApplicationExample {
    public static void main(String[] args) {
        // 创建二项分布（n=100, p=0.3） / Create binomial distribution (n=100, p=0.3)
        BinomialDistribution binomial = Stats.binomial(100, 0.3f);
        System.out.println("二项分布(n=100, p=0.3): " + binomial + " / Binomial distribution (n=100, p=0.3): " + binomial);
        
        // 基本统计量 / Basic statistics
        System.out.println("均值: " + binomial.mean() + " / Mean: " + binomial.mean());
        System.out.println("方差: " + binomial.var() + " / Variance: " + binomial.var());
        System.out.println("标准差: " + binomial.std() + " / Standard deviation: " + binomial.std());
        
        // 概率质量函数 / Probability mass function
        System.out.println("\n概率质量函数: / Probability mass function:");
        for (int k = 20; k <= 40; k += 5) {
            System.out.printf("P(X = %d) = %.4f%n", k, binomial.pmf(k));
        }
        
        // 累积分布函数 / Cumulative distribution function
        System.out.println("\n累积分布函数: / Cumulative distribution function:");
        for (int k = 20; k <= 40; k += 5) {
            System.out.printf("P(X ≤ %d) = %.4f%n", k, binomial.cdf(k));
        }
        
        // 随机采样 / Random sampling
        System.out.println("\n随机采样: / Random sampling:");
        int[] samples = new int[1000];
        for (int i = 0; i < 1000; i++) {
            samples[i] = (int) binomial.sample();
        }
        
        // 计算样本统计量 / Calculate sample statistics
        float sampleMean = 0;
        for (int sample : samples) {
            sampleMean += sample;
        }
        sampleMean /= samples.length;
        
        System.out.printf("样本均值: %.4f (理论值: %.4f) / Sample mean: %.4f (theoretical: %.4f)%n", sampleMean, binomial.mean(), sampleMean, binomial.mean());
    }
}

第五部分：专业应用 (Level 5 - 专业应用) / Part 5: Professional Applications (Level 5 - Professional Applications)

5.1 质量控制分析 / Quality Control Analysis

public class QualityControlAnalysisExample {
    public static void main(String[] args) {
        System.out.println("=== 质量控制统计分析示例 / Quality Control Statsistical Analysis Example ===");
        
        // 模拟生产过程中的产品重量数据 / Simulate product weight data in production process
        // 假设产品重量应该服从正态分布，均值为100g，标准差为2g / Assume product weight follows normal distribution with mean=100g, std=2g
        NormalDistribution targetDist = Stats.norm(100.0f, 2.0f);
        
        // 生成样本数据（模拟实际测量结果） / Generate sample data (simulate actual measurement results)
        float[] measurements = targetDist.sample(50);
        IVector sample = Linalg.vector(measurements);
        
        System.out.println("产品重量测量数据: / Product weight measurement data:");
        System.out.println("  样本大小: " + sample.length() + " / Sample size: " + sample.length());
        System.out.println("  样本均值: " + sample.mean() + " / Sample mean: " + sample.mean());
        System.out.println("  样本标准差: " + sample.std() + " / Sample standard deviation: " + sample.std());
        System.out.println("  最小值: " + sample.min() + " / Minimum: " + sample.min());
        System.out.println("  最大值: " + sample.max() + " / Maximum: " + sample.max());
        
        // 参数估计 / Parameter estimation
        ParameterEstimation estimator = new ParameterEstimation();
        Tuple2<Float, Float> meanCI = estimator.estimateMeanIntevalWithT(sample, 0.95f);
        Tuple2<Float, Float> varCI = estimator.estimateVarIntevalWithChi2(sample, 0.95f);
        
        System.out.println("\n参数估计结果: / Parameter estimation results:");
        System.out.println("  均值95%置信区间: [" + meanCI._1 + ", " + meanCI._2 + "] / Mean 95% confidence interval: [" + meanCI._1 + ", " + meanCI._2 + "]");
        System.out.println("  方差95%置信区间: [" + varCI._1 + ", " + varCI._2 + "] / Variance 95% confidence interval: [" + varCI._1 + ", " + varCI._2 + "]");
        
        // 假设检验 / Hypothesis testing
        HypothesisTesting tester = new HypothesisTesting();
        
        // 检验均值是否等于目标值100g / Test if mean equals target value 100g
        TestingResult meanTest = tester.testMeanEqualWithT(100.0f, sample, 0.95f);
        System.out.println("\n均值检验 (H0: μ = 100g): / Mean test (H0: μ = 100g):");
        System.out.println("  检验结果: " + (meanTest.pass ? "✓ 生产过程正常" : "✗ 生产过程异常") + " / Test result: " + (meanTest.pass ? "✓ Production process normal" : "✗ Production process abnormal"));
        System.out.println("  p值: " + meanTest.p + " / p-value: " + meanTest.p);
        
        // 检验方差是否等于目标值4.0 / Test if variance equals target value 4.0
        TestingResult varTest = tester.testVarEqualWithChi2(4.0f, sample, 0.95f);
        System.out.println("\n方差检验 (H0: σ² = 4.0): / Variance test (H0: σ² = 4.0):");
        System.out.println("  检验结果: " + (varTest.pass ? "✓ 过程稳定性正常" : "✗ 过程稳定性异常") + " / Test result: " + (varTest.pass ? "✓ Process stability normal" : "✗ Process stability abnormal"));
        System.out.println("  p值: " + varTest.p + " / p-value: " + varTest.p);
        
        // 计算不合格品概率 / Calculate defective product probability
        NormalDistribution estimatedDist = Stats.norm(sample.mean(), sample.std());
        float lowerLimit = 95.0f;  // 下限
        float upperLimit = 105.0f; // 上限
        
        float probBelowLower = estimatedDist.cdf(lowerLimit);
        float probAboveUpper = 1.0f - estimatedDist.cdf(upperLimit);
        float defectProb = probBelowLower + probAboveUpper;
        
        System.out.println("\n质量分析: / Quality analysis:");
        System.out.println("  不合格品概率: " + (defectProb * 100) + "% / Defect probability: " + (defectProb * 100) + "%");
        System.out.println("  低于下限概率: " + (probBelowLower * 100) + "% / Below lower limit probability: " + (probBelowLower * 100) + "%");
        System.out.println("  高于上限概率: " + (probAboveUpper * 100) + "% / Above upper limit probability: " + (probAboveUpper * 100) + "%");
    }
}

5.2 金融风险评估 / Financial Risk Assessment

public class FinancialRiskAssessmentExample {
    public static void main(String[] args) {
        System.out.println("=== 金融风险评估示例 / Financial Risk Assessment Example ===");
        
        // 模拟股票收益率数据（假设服从正态分布） / Simulate stock return data (assume normal distribution)
        NormalDistribution returnDist = Stats.norm(0.001f, 0.02f); // 日收益率：均值0.1%，标准差2% / Daily return: mean 0.1%, std 2%
        float[] dailyReturns = returnDist.sample(252); // 一年的交易日数据 / One year of trading day data
        IVector returns = Linalg.vector(dailyReturns);
        
        System.out.println("股票收益率统计: / Stock return statistics:");
        System.out.println("  样本大小: " + returns.length() + " / Sample size: " + returns.length());
        System.out.println("  平均日收益率: " + (returns.mean() * 100) + "% / Average daily return: " + (returns.mean() * 100) + "%");
        System.out.println("  收益率标准差: " + (returns.std() * 100) + "% / Return standard deviation: " + (returns.std() * 100) + "%");
        System.out.println("  最小日收益率: " + (returns.min() * 100) + "% / Minimum daily return: " + (returns.min() * 100) + "%");
        System.out.println("  最大日收益率: " + (returns.max() * 100) + "% / Maximum daily return: " + (returns.max() * 100) + "%");
        
        // 计算VaR (Value at Risk) / Calculate VaR (Value at Risk)
        float[] sortedReturns = dailyReturns.clone();
        Arrays.sort(sortedReturns);
        
        int var95Index = (int) (sortedReturns.length * 0.05);
        int var99Index = (int) (sortedReturns.length * 0.01);
        
        float var95 = sortedReturns[var95Index];
        float var99 = sortedReturns[var99Index];
        
        System.out.println("\n风险度量: / Risk measures:");
        System.out.println("  VaR 95%: " + (var95 * 100) + "% / VaR 95%: " + (var95 * 100) + "%");
        System.out.println("  VaR 99%: " + (var99 * 100) + "% / VaR 99%: " + (var99 * 100) + "%");
        
        // 使用正态分布计算理论VaR / Calculate theoretical VaR using normal distribution
        NormalDistribution estimatedDist = Stats.norm(returns.mean(), returns.std());
        float theoreticalVar95 = estimatedDist.ppf(0.05f);
        float theoreticalVar99 = estimatedDist.ppf(0.01f);
        
        System.out.println("\n理论VaR (基于正态分布): / Theoretical VaR (based on normal distribution):");
        System.out.println("  VaR 95%: " + (theoreticalVar95 * 100) + "% / VaR 95%: " + (theoreticalVar95 * 100) + "%");
        System.out.println("  VaR 99%: " + (theoreticalVar99 * 100) + "% / VaR 99%: " + (theoreticalVar99 * 100) + "%");
        
        // 计算最大回撤 / Calculate maximum drawdown
        float maxDrawdown = calculateMaxDrawdown(dailyReturns);
        System.out.println("\n最大回撤: " + (maxDrawdown * 100) + "% / Maximum drawdown: " + (maxDrawdown * 100) + "%");
        
        // 计算夏普比率 / Calculate Sharpe ratio
        float riskFreeRate = 0.03f / 252; // 年化无风险利率3%，转换为日利率 / Annual risk-free rate 3%, converted to daily rate
        float sharpeRatio = (returns.mean() - riskFreeRate) / returns.std();
        System.out.println("夏普比率: " + sharpeRatio + " / Sharpe ratio: " + sharpeRatio);
    }
    
    private static float calculateMaxDrawdown(float[] returns) {
        float maxDrawdown = 0.0f;
        float peak = 0.0f;
        float cumulative = 0.0f;
        
        for (float ret : returns) {
            cumulative += ret;
            if (cumulative > peak) {
                peak = cumulative;
            }
            float drawdown = peak - cumulative;
            if (drawdown > maxDrawdown) {
                maxDrawdown = drawdown;
            }
        }
        
        return maxDrawdown;
    }
}

5.3 可靠性分析 / Reliability Analysis

public class ReliabilityAnalysisExample {
    public static void main(String[] args) {
        System.out.println("=== 可靠性分析示例 / Reliability Analysis Example ===");
        
        // 模拟设备故障时间数据（假设服从指数分布） / Simulate equipment failure time data (assume exponential distribution)
        ExponentialDistribution failureDist = Stats.exponential(0.01f); // 故障率λ=0.01/小时 / Failure rate λ=0.01/hour
        float[] failureTimes = failureDist.sample(100); // 100个故障时间样本 / 100 failure time samples
        IVector failures = Linalg.vector(failureTimes);
        
        System.out.println("设备故障时间统计: / Equipment failure time statistics:");
        System.out.println("  样本大小: " + failures.length() + " / Sample size: " + failures.length());
        System.out.println("  平均故障时间: " + failures.mean() + " 小时 / Average failure time: " + failures.mean() + " hours");
        System.out.println("  故障时间标准差: " + failures.std() + " 小时 / Failure time std dev: " + failures.std() + " hours");
        System.out.println("  最短故障时间: " + failures.min() + " 小时 / Shortest failure time: " + failures.min() + " hours");
        System.out.println("  最长故障时间: " + failures.max() + " 小时 / Longest failure time: " + failures.max() + " hours");
        
        // 计算可靠性指标 / Calculate reliability indicators
        float estimatedLambda = 1.0f / failures.mean();
        System.out.println("\n可靠性指标: / Reliability indicators:");
        System.out.println("  估计故障率: " + estimatedLambda + " /小时 / Estimated failure rate: " + estimatedLambda + " /hour");
        System.out.println("  平均故障间隔时间(MTBF): " + failures.mean() + " 小时 / Mean Time Between Failures (MTBF): " + failures.mean() + " hours");
        
        // 计算不同时间点的可靠性 / Calculate reliability at different time points
        float[] timePoints = {10, 50, 100, 200, 500};
        System.out.println("\n可靠性函数 R(t) = e^(-λt): / Reliability function R(t) = e^(-λt):");
        for (float t : timePoints) {
            float reliability = (float) Math.exp(-estimatedLambda * t);
            System.out.println("  R(" + t + ") = " + reliability);
        }
        
        // 计算故障概率密度 / Calculate failure probability density
        System.out.println("\n故障概率密度 f(t) = λe^(-λt): / Failure probability density f(t) = λe^(-λt):");
        for (float t : timePoints) {
            float density = estimatedLambda * (float) Math.exp(-estimatedLambda * t);
            System.out.println("  f(" + t + ") = " + density);
        }
        
        // 计算累积故障概率 / Calculate cumulative failure probability
        System.out.println("\n累积故障概率 F(t) = 1 - e^(-λt): / Cumulative failure probability F(t) = 1 - e^(-λt):");
        for (float t : timePoints) {
            float cumulativeProb = 1.0f - (float) Math.exp(-estimatedLambda * t);
            System.out.println("  F(" + t + ") = " + cumulativeProb);
        }
        
        // 计算中位故障时间 / Calculate median failure time
        float medianTime = (float) (Math.log(2) / estimatedLambda);
        System.out.println("\n中位故障时间: " + medianTime + " 小时 / Median failure time: " + medianTime + " hours");
    }
}

5.4 实验设计分析 / Experimental Design Analysis

public class ExperimentalDesignAnalysisExample {
    public static void main(String[] args) {
        System.out.println("=== 实验设计分析示例 / Experimental Design Analysis Example ===");
        
        // 模拟A/B测试数据 / Simulate A/B test data
        // 对照组：转化率5% / Control group: 5% conversion rate
        BinomialDistribution controlDist = Stats.binomial(1000, 0.05f);
        int controlConversions = (int) controlDist.sample();
        
        // 实验组：转化率6% / Treatment group: 6% conversion rate
        BinomialDistribution treatmentDist = Stats.binomial(1000, 0.06f);
        int treatmentConversions = (int) treatmentDist.sample();
        
        System.out.println("A/B测试结果: / A/B test results:");
        System.out.println("  对照组转化数: " + controlConversions + "/1000 / Control group conversions: " + controlConversions + "/1000");
        System.out.println("  实验组转化数: " + treatmentConversions + "/1000 / Treatment group conversions: " + treatmentConversions + "/1000");
        System.out.println("  对照组转化率: " + (controlConversions / 1000.0f * 100) + "% / Control group conversion rate: " + (controlConversions / 1000.0f * 100) + "%");
        System.out.println("  实验组转化率: " + (treatmentConversions / 1000.0f * 100) + "% / Treatment group conversion rate: " + (treatmentConversions / 1000.0f * 100) + "%");
        
        // 计算转化率差异 / Calculate conversion rate difference
        float controlRate = controlConversions / 1000.0f;
        float treatmentRate = treatmentConversions / 1000.0f;
        float rateDifference = treatmentRate - controlRate;
        
        System.out.println("\n转化率差异: " + (rateDifference * 100) + "% / Conversion rate difference: " + (rateDifference * 100) + "%");
        
        // 计算置信区间 / Calculate confidence interval
        float controlStdError = (float) Math.sqrt(controlRate * (1 - controlRate) / 1000);
        float treatmentStdError = (float) Math.sqrt(treatmentRate * (1 - treatmentRate) / 1000);
        float diffStdError = (float) Math.sqrt(controlStdError * controlStdError + treatmentStdError * treatmentStdError);
        
        // 使用正态分布近似 / Use normal distribution approximation
        NormalDistribution diffDist = Stats.norm(rateDifference, diffStdError);
        float lowerBound = diffDist.ppf(0.025f);
        float upperBound = diffDist.ppf(0.975f);
        
        System.out.println("\n转化率差异95%置信区间: / Conversion rate difference 95% confidence interval:");
        System.out.println("  [" + (lowerBound * 100) + "%, " + (upperBound * 100) + "%] / [" + (lowerBound * 100) + "%, " + (upperBound * 100) + "%]");
        
        // 假设检验 / Hypothesis testing
        HypothesisTesting tester = new HypothesisTesting();
        
        // 创建样本数据用于检验 / Create sample data for testing
        float[] controlData = new float[1000];
        float[] treatmentData = new float[1000];
        
        for (int i = 0; i < 1000; i++) {
            controlData[i] = controlDist.sample();
            treatmentData[i] = treatmentDist.sample();
        }
        
        IVector controlVector = Linalg.vector(controlData);
        IVector treatmentVector = Linalg.vector(treatmentData);
        
        // 检验两组均值是否相等 / Test if two group means are equal
        TestingResult meanTest = tester.testMeanEqualWithT(0.0f, 
            Linalg.vector(new float[]{rateDifference}), 0.95f);
        
        System.out.println("\n假设检验 (H0: 转化率差异 = 0): / Hypothesis test (H0: conversion rate difference = 0):");
        System.out.println("  检验结果: " + (meanTest.pass ? "接受原假设" : "拒绝原假设") + " / Test result: " + (meanTest.pass ? "Accept null hypothesis" : "Reject null hypothesis"));
        System.out.println("  p值: " + meanTest.p + " / p-value: " + meanTest.p);
        
        // 计算统计功效 / Calculate statistical power
        float effectSize = Math.abs(rateDifference) / diffStdError;
        System.out.println("\n效应量 (Cohen's d): " + effectSize + " / Effect size (Cohen's d): " + effectSize);
        
        if (effectSize < 0.2) {
            System.out.println("  效应量: 小 / Effect size: Small");
        } else if (effectSize < 0.5) {
            System.out.println("  效应量: 中等 / Effect size: Medium");
        } else {
            System.out.println("  效应量: 大 / Effect size: Large");
        }
    }
}

5.5 方差分析应用 / Analysis of Variance (ANOVA) Applications

public class ANOVAApplicationExample {
    public static void main(String[] args) {
        System.out.println("=== 方差分析应用示例 / Analysis of Variance (ANOVA) Application Example ===");
        
        // 单因素方差分析示例 / One-way ANOVA example
        demonstrateOneWayANOVA();
        
        // 两因素方差分析示例 / Two-way ANOVA example
        demonstrateTwoWayANOVA();
        
        // 重复测量方差分析示例 / Repeated measures ANOVA example
        demonstrateRepeatedMeasuresANOVA();
        
        // 假设检验示例 / Assumption tests example
        demonstrateAssumptionTests();
    }
    
    public static void demonstrateOneWayANOVA() {
        System.out.println("\n--- 单因素方差分析示例 / One-Way ANOVA Example ---");
        
        // 创建三个组的数据 / Create data for three groups
        // 假设研究不同教学方法对学生成绩的影响 / Assume studying the impact of different teaching methods on student performance
        IVector traditionalMethod = Linalg.vector(new float[]{75, 78, 82, 85, 88, 90, 92, 95});
        IVector onlineMethod = Linalg.vector(new float[]{70, 73, 76, 79, 82, 85, 87, 90});
        IVector hybridMethod = Linalg.vector(new float[]{80, 83, 86, 89, 92, 95, 97, 100});
        
        System.out.println("教学方法数据: / Teaching method data:");
        System.out.println("  传统方法: " + traditionalMethod.mean() + " ± " + traditionalMethod.std() + " / Traditional method: " + traditionalMethod.mean() + " ± " + traditionalMethod.std());
        System.out.println("  在线方法: " + onlineMethod.mean() + " ± " + onlineMethod.std() + " / Online method: " + onlineMethod.mean() + " ± " + onlineMethod.std());
        System.out.println("  混合方法: " + hybridMethod.mean() + " ± " + hybridMethod.std() + " / Hybrid method: " + hybridMethod.mean() + " ± " + hybridMethod.std());
        
        // 执行单因素方差分析 / Perform one-way ANOVA
        ANOVAResult result = Stats.anova.performOneWayANOVA(traditionalMethod, onlineMethod, hybridMethod);
        
        System.out.println("\n单因素方差分析结果: / One-way ANOVA results:");
        System.out.println("  F统计量: " + result.fStatsistic + " / F-statistic: " + result.fStatsistic);
        System.out.println("  p值: " + result.pValue + " / p-value: " + result.pValue);
        System.out.println("  组间平方和: " + result.ssBetween + " / Sum of squares between groups: " + result.ssBetween);
        System.out.println("  组内平方和: " + result.ssWithin + " / Sum of squares within groups: " + result.ssWithin);
        System.out.println("  总平方和: " + result.ssTotal + " / Total sum of squares: " + result.ssTotal);
        
        // 解释结果 / Interpret results
        if (result.pValue < 0.05) {
            System.out.println("  结论: 不同教学方法对学生成绩有显著影响 (p < 0.05) / Conclusion: Different teaching methods have significant effect on student performance (p < 0.05)");
        } else {
            System.out.println("  结论: 不同教学方法对学生成绩无显著影响 (p ≥ 0.05) / Conclusion: Different teaching methods have no significant effect on student performance (p ≥ 0.05)");
        }
        
        // 执行Tukey HSD多重比较 / Perform Tukey HSD multiple comparisons
        ANOVA.performTukeyHSD(traditionalMethod, onlineMethod, hybridMethod);
    }
    
    public static void demonstrateTwoWayANOVA() {
        System.out.println("\n--- 两因素方差分析示例 / Two-Way ANOVA Example ---");
        
        // 创建两因素数据 [教学方法][学习风格] / Create two-factor data [teaching method][learning style]
        // 因素A: 教学方法 (传统 vs 在线) / Factor A: Teaching method (Traditional vs Online)
        // 因素B: 学习风格 (视觉型 vs 听觉型) / Factor B: Learning style (Visual vs Auditory)
        float[][][] data = {
            // 传统方法 / Traditional method
            {{85, 87, 89, 91}, {78, 80, 82, 84}},  // 视觉型, 听觉型 / Visual, Auditory
            // 在线方法 / Online method
            {{88, 90, 92, 94}, {81, 83, 85, 87}}   // 视觉型, 听觉型 / Visual, Auditory
        };
        
        System.out.println("两因素实验设计: / Two-factor experimental design:");
        System.out.println("  因素A: 教学方法 (传统 vs 在线) / Factor A: Teaching method (Traditional vs Online)");
        System.out.println("  因素B: 学习风格 (视觉型 vs 听觉型) / Factor B: Learning style (Visual vs Auditory)");
        
        // 执行两因素方差分析 / Perform two-way ANOVA
        TwoWayANOVAResult result = Stats.anova.performTwoWayANOVA(data);
        
        System.out.println("\n两因素方差分析结果: / Two-way ANOVA results:");
        System.out.println("  教学方法主效应: F=" + result.factorAF + ", p=" + result.factorAP + " / Teaching method main effect: F=" + result.factorAF + ", p=" + result.factorAP);
        System.out.println("  学习风格主效应: F=" + result.factorBF + ", p=" + result.factorBP + " / Learning style main effect: F=" + result.factorBF + ", p=" + result.factorBP);
        System.out.println("  交互效应: F=" + result.interactionF + ", p=" + result.interactionP + " / Interaction effect: F=" + result.interactionF + ", p=" + result.interactionP);
        
        // 解释结果 / Interpret results
        System.out.println("\n结果解释: / Result interpretation:");
        if (result.factorAP < 0.05) {
            System.out.println("  教学方法有显著主效应 / Teaching method has significant main effect");
        }
        if (result.factorBP < 0.05) {
            System.out.println("  学习风格有显著主效应 / Learning style has significant main effect");
        }
        if (result.interactionP < 0.05) {
            System.out.println("  教学方法与学习风格存在显著交互效应 / Significant interaction between teaching method and learning style");
        }
    }
    
    public static void demonstrateRepeatedMeasuresANOVA() {
        System.out.println("\n--- 重复测量方差分析示例 / Repeated Measures ANOVA Example ---");
        
        // 创建重复测量数据 [被试][时间点] / Create repeated measures data [subjects][time points]
        // 研究训练前后和训练后的技能水平变化 / Study skill level changes before, during, and after training
        float[][] data = {
            {60, 65, 70, 75},  // 被试1: 训练前, 训练中, 训练后, 随访 / Subject 1: Pre-training, During training, Post-training, Follow-up
            {55, 62, 68, 72},  // 被试2 / Subject 2
            {58, 64, 69, 74},  // 被试3 / Subject 3
            {62, 67, 72, 77},  // 被试4 / Subject 4
            {57, 63, 68, 73}   // 被试5 / Subject 5
        };
        
        System.out.println("重复测量实验设计: / Repeated measures experimental design:");
        System.out.println("  被试数: " + data.length + " / Number of subjects: " + data.length);
        System.out.println("  测量时间点: " + data[0].length + " / Number of time points: " + data[0].length);
        System.out.println("  时间点: 训练前, 训练中, 训练后, 随访 / Time points: Pre-training, During training, Post-training, Follow-up");
        
        // 执行重复测量方差分析 / Perform repeated measures ANOVA
        RepeatedMeasuresANOVAResult result = Stats.anova.performRepeatedMeasuresANOVA(data);
        
        System.out.println("\n重复测量方差分析结果: / Repeated measures ANOVA results:");
        System.out.println("  时间效应: F=" + result.timeF + ", p=" + result.timeP + " / Time effect: F=" + result.timeF + ", p=" + result.timeP);
        System.out.println("  被试效应: F=" + result.subjectF + ", p=" + result.subjectP + " / Subject effect: F=" + result.subjectF + ", p=" + result.subjectP);
        
        // 解释结果 / Interpret results
        System.out.println("\n结果解释: / Result interpretation:");
        if (result.timeP < 0.05) {
            System.out.println("  时间因素有显著效应，技能水平随时间显著变化 / Time factor has significant effect, skill level changes significantly over time");
        } else {
            System.out.println("  时间因素无显著效应，技能水平随时间无显著变化 / Time factor has no significant effect, skill level does not change significantly over time");
        }
        if (result.subjectP < 0.05) {
            System.out.println("  被试间存在显著差异 / Significant differences exist between subjects");
        }
    }
    
    public static void demonstrateAssumptionTests() {
        System.out.println("\n--- 假设检验示例 / Assumption Tests Example ---");
        
        // 创建示例数据 / Create sample data
        IVector sample1 = Linalg.vector(new float[]{1.2f, 2.3f, 1.8f, 3.1f, 2.7f});
        IVector sample2 = Linalg.vector(new float[]{2.1f, 3.2f, 2.8f, 4.1f, 3.5f});
        IVector sample3 = Linalg.vector(new float[]{3.2f, 4.1f, 3.8f, 5.2f, 4.6f});
        
        System.out.println("假设检验: / Assumption tests:");
        
        // 正态性检验 / Normality test
        System.out.println("\n1. 正态性检验 / Normality Test:");
        boolean isNormal1 = Stats.anova.testNormality(sample1);
        boolean isNormal2 = Stats.anova.testNormality(sample2);
        boolean isNormal3 = Stats.anova.testNormality(sample3);
        
        System.out.println("  样本1正态性: " + (isNormal1 ? "通过" : "未通过") + " / Sample 1 normality: " + (isNormal1 ? "Pass" : "Fail"));
        System.out.println("  样本2正态性: " + (isNormal2 ? "通过" : "未通过") + " / Sample 2 normality: " + (isNormal2 ? "Pass" : "Fail"));
        System.out.println("  样本3正态性: " + (isNormal3 ? "通过" : "未通过") + " / Sample 3 normality: " + (isNormal3 ? "Pass" : "Fail"));
        
        // 方差齐性检验 / Homogeneity of variance test
        System.out.println("\n2. 方差齐性检验 / Homogeneity of Variance Test:");
        boolean isHomogeneous = Stats.anova.testHomogeneityOfVariance(sample1, sample2, sample3);
        System.out.println("  方差齐性: " + (isHomogeneous ? "通过" : "未通过") + " / Variance homogeneity: " + (isHomogeneous ? "Pass" : "Fail"));
        
        // 给出建议 / Provide recommendations
        System.out.println("\n3. 分析建议 / Analysis Recommendations:");
        if (isNormal1 && isNormal2 && isNormal3 && isHomogeneous) {
            System.out.println("  所有假设均满足，可以使用参数检验方法 / All assumptions met, parametric tests can be used");
        } else {
            System.out.println("  部分假设未满足，建议使用非参数检验方法 / Some assumptions not met, non-parametric tests recommended");
        }
    }
}

5.6 蒙特卡洛模拟 / Monte Carlo Simulation

public class MonteCarloSimulationExample {
    public static void main(String[] args) {
        System.out.println("=== 蒙特卡洛模拟示例 / Monte Carlo Simulation Example ===");
        
        // 期权定价模拟 / Option pricing simulation
        simulateOptionPricing();
        
        // 风险评估模拟 / Risk assessment simulation
        simulateRiskAssessment();
        
        // 质量控制模拟 / Quality control simulation
        simulateQualityControl();
    }
    
    public static void simulateOptionPricing() {
        System.out.println("\n--- 期权定价蒙特卡洛模拟 / Option Pricing Monte Carlo Simulation ---");
        
        // 参数设置 / Parameter settings
        float S0 = 100.0f;      // 当前股价 / Current stock price
        float K = 105.0f;       // 执行价格 / Strike price
        float r = 0.05f;        // 无风险利率 / Risk-free rate
        float sigma = 0.2f;     // 波动率 / Volatility
        float T = 1.0f;         // 到期时间 / Time to maturity
        int nSimulations = 100000;
        
        // 创建正态分布 / Create normal distribution
        NormalDistribution normal = Stats.norm();
        
        float[] payoffs = new float[nSimulations];
        
        // 蒙特卡洛模拟 / Monte Carlo simulation
        for (int i = 0; i < nSimulations; i++) {
            float z = normal.sample();
            float ST = S0 * (float) Math.exp((r - 0.5f * sigma * sigma) * T + sigma * (float) Math.sqrt(T) * z);
            payoffs[i] = Math.max(ST - K, 0.0f); // 看涨期权 / Call option
        }
        
        // 计算期权价格 / Calculate option price
        float optionPrice = calculateMean(payoffs) * (float) Math.exp(-r * T);
        
        System.out.printf("模拟次数: %d / Number of simulations: %d%n", nSimulations, nSimulations);
        System.out.printf("期权价格: %.4f / Option price: %.4f%n", optionPrice, optionPrice);
        System.out.printf("标准差: %.4f / Standard deviation: %.4f%n", calculateStd(payoffs), calculateStd(payoffs));
    }
    
    public static void simulateRiskAssessment() {
        System.out.println("\n--- 风险评估蒙特卡洛模拟 / Risk Assessment Monte Carlo Simulation ---");
        
        // 投资组合参数 / Portfolio parameters
        float[] weights = {0.4f, 0.3f, 0.3f};  // 权重 / Weights
        float[] means = {0.08f, 0.12f, 0.06f}; // 预期收益率 / Expected returns
        float[] stds = {0.15f, 0.25f, 0.10f};  // 标准差 / Standard deviations
        int nSimulations = 50000;
        int timeHorizon = 252; // 交易日 / Trading days
        
        // 创建正态分布 / Create normal distribution
        NormalDistribution[] distributions = new NormalDistribution[3];
        for (int i = 0; i < 3; i++) {
            distributions[i] = Stats.norm(means[i], stds[i]);
        }
        
        float[] portfolioReturns = new float[nSimulations];
        
        // 蒙特卡洛模拟 / Monte Carlo simulation
        for (int sim = 0; sim < nSimulations; sim++) {
            float portfolioReturn = 0.0f;
            for (int i = 0; i < 3; i++) {
                float dailyReturn = distributions[i].sample() / (float) Math.sqrt(timeHorizon);
                portfolioReturn += weights[i] * dailyReturn;
            }
            portfolioReturns[sim] = portfolioReturn;
        }
        
        // 计算风险指标 / Calculate risk metrics
        float meanReturn = calculateMean(portfolioReturns);
        float stdReturn = calculateStd(portfolioReturns);
        float var95 = calculatePercentile(portfolioReturns, 0.05f);
        float var99 = calculatePercentile(portfolioReturns, 0.01f);
        
        System.out.printf("预期收益率: %.4f / Expected return: %.4f%n", meanReturn, meanReturn);
        System.out.printf("收益率标准差: %.4f / Return standard deviation: %.4f%n", stdReturn, stdReturn);
        System.out.printf("95%% VaR: %.4f / 95%% VaR: %.4f%n", var95, var95);
        System.out.printf("99%% VaR: %.4f / 99%% VaR: %.4f%n", var99, var99);
    }
    
    public static void simulateQualityControl() {
        System.out.println("\n--- 质量控制蒙特卡洛模拟 / Quality Control Monte Carlo Simulation ---");
        
        // 质量控制参数 / Quality control parameters
        float targetMean = 100.0f;     // 目标均值 / Target mean
        float targetStd = 5.0f;        // 目标标准差 / Target standard deviation
        float specLower = 90.0f;       // 规格下限 / Specification lower limit
        float specUpper = 110.0f;      // 规格上限 / Specification upper limit
        int nSimulations = 100000;
        int sampleSize = 30;
        
        // 创建正态分布 / Create normal distribution
        NormalDistribution normal = Stats.norm(targetMean, targetStd);
        
        int defectCount = 0;
        
        // 蒙特卡洛模拟 / Monte Carlo simulation
        for (int sim = 0; sim < nSimulations; sim++) {
            float[] sample = normal.sample(sampleSize);
            
            // 检查是否有不合格品 / Check for defective products
            boolean hasDefect = false;
            for (float value : sample) {
                if (value < specLower || value > specUpper) {
                    hasDefect = true;
                    break;
                }
            }
            
            if (hasDefect) {
                defectCount++;
            }
        }
        
        float defectRate = (float) defectCount / nSimulations;
        System.out.printf("模拟次数: %d / Number of simulations: %d%n", nSimulations, nSimulations);
        System.out.printf("样本大小: %d / Sample size: %d%n", sampleSize, sampleSize);
        System.out.printf("不合格品率: %.4f%% / Defect rate: %.4f%%%n", defectRate * 100, defectRate * 100);
    }
    
    // 辅助方法 / Helper methods
    private static float calculateMean(float[] data) {
        float sum = 0;
        for (float value : data) {
            sum += value;
        }
        return sum / data.length;
    }
    
    private static float calculateStd(float[] data) {
        float mean = calculateMean(data);
        float sumSquaredDiff = 0;
        for (float value : data) {
            float diff = value - mean;
            sumSquaredDiff += diff * diff;
        }
        return (float) Math.sqrt(sumSquaredDiff / data.length);
    }
    
    private static float calculatePercentile(float[] data, float percentile) {
        float[] sorted = data.clone();
        Arrays.sort(sorted);
        int index = (int) (sorted.length * percentile);
        return sorted[index];
    }
}

第六部分：高级统计建模 (Level 6 - 高级统计建模) / Part 6: Advanced Statistical Modeling (Level 6 - Advanced Statistical Modeling)

6.1 多元分布应用 / Multivariate Distribution Applications

public class MultivariateDistributionExample {
    public static void main(String[] args) {
        System.out.println("=== 多元分布应用示例 / Multivariate Distribution Application Example ===");
        
        // 多元正态分布示例 / Multivariate normal distribution example
        demonstrateMultivariateNormal();
        
        // 多元t分布示例 / Multivariate t-distribution example
        demonstrateMultivariateT();
        
        // 多元均匀分布示例 / Multivariate uniform distribution example
        demonstrateMultivariateUniform();
    }
    
    public static void demonstrateMultivariateNormal() {
        System.out.println("\n--- 多元正态分布示例 / Multivariate Normal Distribution Example ---");
        
        // 创建3维多元正态分布 / Create 3D multivariate normal distribution
        double[] mean = {1.0, 2.0, 3.0};
        double[][] covariance = {
            {1.0, 0.5, 0.2},
            {0.5, 1.0, 0.3},
            {0.2, 0.3, 1.0}
        };
        
        MultivariateNormalDistribution mvn = MultivariateDistributions.normal(mean, covariance);
        
        System.out.println("多元正态分布参数: / Multivariate normal distribution parameters:");
        System.out.println("  均值向量: " + Arrays.toString(mean) + " / Mean vector: " + Arrays.toString(mean));
        System.out.println("  协方差矩阵: / Covariance matrix:");
        for (double[] row : covariance) {
            System.out.println("    " + Arrays.toString(row));
        }
        
        // 计算概率密度函数 / Calculate probability density function
        double[] x = {1.5, 2.5, 3.5};
        double pdfValue = mvn.pdf(x);
        System.out.println("PDF值: " + pdfValue + " / PDF value: " + pdfValue);
        
        // 生成随机样本 / Generate random samples
        double[][] samples = mvn.sample(1000);
        System.out.println("生成了 " + samples.length + " 个随机样本 / Generated " + samples.length + " random samples");
        
        // 计算样本统计量 / Calculate sample statistics
        IVector<Double> sample1 = Linalg.vector(Arrays.stream(samples).mapToDouble(s -> s[0]).toArray());
        IVector<Double> sample2 = Linalg.vector(Arrays.stream(samples).mapToDouble(s -> s[1]).toArray());
        IVector<Double> sample3 = Linalg.vector(Arrays.stream(samples).mapToDouble(s -> s[2]).toArray());
        
        System.out.println("样本统计量: / Sample statistics:");
        System.out.println("  第1维均值: " + sample1.mean() + " (理论值: " + mean[0] + ") / Dim 1 mean: " + sample1.mean() + " (theoretical: " + mean[0] + ")");
        System.out.println("  第2维均值: " + sample2.mean() + " (理论值: " + mean[1] + ") / Dim 2 mean: " + sample2.mean() + " (theoretical: " + mean[1] + ")");
        System.out.println("  第3维均值: " + sample3.mean() + " (理论值: " + mean[2] + ") / Dim 3 mean: " + sample3.mean() + " (theoretical: " + mean[2] + ")");
    }
    
    public static void demonstrateMultivariateT() {
        System.out.println("\n--- 多元t分布示例 / Multivariate t-Distribution Example ---");
        
        // 创建2维多元t分布 / Create 2D multivariate t-distribution
        IVector<Double> mean = Linalg.vector(new double[]{0.0, 0.0});
        IMatrix<Double> scale = Linalg.eye(2);
        double degreesOfFreedom = 5.0;
        
        MultivariateTDistribution mvt = MultivariateDistributions.t(mean, scale, degreesOfFreedom);
        
        System.out.println("多元t分布参数: / Multivariate t-distribution parameters:");
        System.out.println("  自由度: " + degreesOfFreedom + " / Degrees of freedom: " + degreesOfFreedom);
        
        // 计算概率密度函数 / Calculate probability density function
        double[] x = {1.0, 2.0};
        double pdfValue = mvt.pdf(x);
        System.out.println("PDF值: " + pdfValue + " / PDF value: " + pdfValue);
        
        // 生成随机样本 / Generate random samples
        double[][] samples = mvt.sample(1000);
        System.out.println("生成了 " + samples.length + " 个随机样本 / Generated " + samples.length + " random samples");
    }
    
    public static void demonstrateMultivariateUniform() {
        System.out.println("\n--- 多元均匀分布示例 / Multivariate Uniform Distribution Example ---");
        
        // 创建2维多元均匀分布 / Create 2D multivariate uniform distribution
        double[] low = {0.0, 0.0};
        double[] high = {1.0, 2.0};
        
        MultivariateUniformDistribution mvu = MultivariateDistributions.uniform(low, high);
        
        System.out.println("多元均匀分布参数: / Multivariate uniform distribution parameters:");
        System.out.println("  下界: " + Arrays.toString(low) + " / Lower bound: " + Arrays.toString(low));
        System.out.println("  上界: " + Arrays.toString(high) + " / Upper bound: " + Arrays.toString(high));
        
        // 计算概率密度函数 / Calculate probability density function
        double[] x = {0.5, 1.0};
        double pdfValue = mvu.pdf(x);
        System.out.println("PDF值: " + pdfValue + " / PDF value: " + pdfValue);
        
        // 生成随机样本 / Generate random samples
        double[][] samples = mvu.sample(1000);
        System.out.println("生成了 " + samples.length + " 个随机样本 / Generated " + samples.length + " random samples");
    }
}

6.2 高斯混合模型应用 / Gaussian Mixture Model Applications

public class GaussianMixtureModelExample {
    public static void main(String[] args) {
        System.out.println("=== 高斯混合模型应用示例 / Gaussian Mixture Model Application Example ===");
        
        // 创建和训练GMM / Create and train GMM
        demonstrateGMMTraining();
        
        // 聚类分析 / Clustering analysis
        demonstrateClustering();
        
        // 密度估计 / Density estimation
        demonstrateDensityEstimation();
    }
    
    public static void demonstrateGMMTraining() {
        System.out.println("\n--- GMM训练示例 / GMM Training Example ---");
        
        // 创建模拟数据 / Create simulated data
        double[][] data = generateSimulatedData();
        
        System.out.println("训练数据: " + data.length + " 个样本, " + data[0].length + " 维 / Training data: " + data.length + " samples, " + data[0].length + " dimensions");
        
        // 创建GMM模型 / Create GMM model
        GaussianMixtureModel gmm = new GaussianMixtureModel(3, 2); // 3个分量，2维数据
        
        // 使用EM算法训练模型 / Train model using EM algorithm
        EMAlgorithm em = new EMAlgorithm();
        List<IVector<Double>> dataList = Arrays.stream(data).map(IVector::of).toList();
        EMAlgorithm.EMResult result = em.fit(dataList, gmm);
        
        System.out.println("训练结果: / Training results:");
        System.out.println("  收敛: " + result.converged + " / Converged: " + result.converged);
        System.out.println("  迭代次数: " + result.iterations + " / Iterations: " + result.iterations);
        System.out.println("  最终对数似然: " + result.logLikelihood + " / Final log-likelihood: " + result.logLikelihood);
        
        // 显示模型参数 / Display model parameters
        System.out.println("模型参数: / Model parameters:");
        for (int i = 0; i < gmm.getNumComponents(); i++) {
            System.out.println("  分量 " + i + " 权重: " + gmm.getWeights().get(i) + " / Component " + i + " weight: " + gmm.getWeights().get(i));
        }
    }
    
    public static void demonstrateClustering() {
        System.out.println("\n--- 聚类分析示例 / Clustering Analysis Example ---");
        
        // 创建GMM模型 / Create GMM model
        GaussianMixtureModel gmm = new GaussianMixtureModel(3, 2);
        
        // 准备测试数据 / Prepare test data
        double[][] testData = {
            {1.2, 2.3}, {1.5, 2.6}, {1.8, 2.9},
            {5.1, 6.2}, {5.4, 6.5}, {5.7, 6.8},
            {9.0, 10.1}, {9.3, 10.4}, {9.6, 10.7}
        };
        
        // 对新数据进行聚类 / Cluster new data
        int[] clusterAssignments = new int[testData.length];
        for (int i = 0; i < testData.length; i++) {
            clusterAssignments[i] = gmm.predictComponent(IVector.of(testData[i]));
        }

        System.out.println("聚类结果: / Clustering results:");
        for (int i = 0; i < testData.length; i++) {
            System.out.println("  数据点 " + i + ": " + Arrays.toString(testData[i]) + " -> 聚类 " + clusterAssignments[i] + " / Data point " + i + ": " + Arrays.toString(testData[i]) + " -> Cluster " + clusterAssignments[i]);
        }
        
        // 计算后验概率 / Calculate posterior probabilities
        double[][] posteriors = gmm.computePosteriors(testData);
        System.out.println("后验概率: / Posterior probabilities:");
        for (int i = 0; i < testData.length; i++) {
            System.out.println("  数据点 " + i + ": " + Arrays.toString(posteriors[i]) + " / Data point " + i + ": " + Arrays.toString(posteriors[i]));
        }
    }
    
    public static void demonstrateDensityEstimation() {
        System.out.println("\n--- 密度估计示例 / Density Estimation Example ---");
        
        // 创建GMM模型 / Create GMM model
        GaussianMixtureModel gmm = new GaussianMixtureModel(2, 2);
        
        // 准备测试数据 / Prepare test data
        double[][] testData = {
            {1.0, 2.0}, {1.5, 2.5}, {2.0, 3.0},
            {5.0, 6.0}, {5.5, 6.5}, {6.0, 7.0}
        };
        
        // 计算概率密度 / Calculate probability density
        double[] densities = new double[testData.length];
        for (int i = 0; i < testData.length; i++) {
            densities[i] = gmm.pdf(IVector.of(testData[i]));
            System.out.println("  数据点 " + i + ": " + Arrays.toString(testData[i]) + " -> 密度 " + densities[i] + " / Data point " + i + ": " + Arrays.toString(testData[i]) + " -> Density " + densities[i]);
        }
    }
    
    private static double[][] generateSimulatedData() {
        // 生成模拟的聚类数据 / Generate simulated clustering data
        double[][] data = new double[300][2];
        Random random = new Random(42);
        
        // 第一个聚类 / First cluster
        for (int i = 0; i < 100; i++) {
            data[i][0] = 1.0 + random.nextGaussian() * 0.5;
            data[i][1] = 2.0 + random.nextGaussian() * 0.5;
        }
        
        // 第二个聚类 / Second cluster
        for (int i = 100; i < 200; i++) {
            data[i][0] = 5.0 + random.nextGaussian() * 0.5;
            data[i][1] = 6.0 + random.nextGaussian() * 0.5;
        }
        
        // 第三个聚类 / Third cluster
        for (int i = 200; i < 300; i++) {
            data[i][0] = 9.0 + random.nextGaussian() * 0.5;
            data[i][1] = 10.0 + random.nextGaussian() * 0.5;
        }
        
        return data;
    }
}

6.3 EM算法高级应用 / EM Algorithm Advanced Applications

public class EMAlgorithmAdvancedExample {
    public static void main(String[] args) {
        System.out.println("=== EM算法高级应用示例 / EM Algorithm Advanced Application Example ===");
        
        // 参数估计示例 / Parameter estimation example
        demonstrateParameterEstimation();
        
        // 模型选择示例 / Model selection example
        demonstrateModelSelection();
        
        // 收敛性分析示例 / Convergence analysis example
        demonstrateConvergenceAnalysis();
    }
    
    public static void demonstrateParameterEstimation() {
        System.out.println("\n--- 参数估计示例 / Parameter Estimation Example ---");
        
        // 创建已知参数的GMM / Create GMM with known parameters
        List<MultivariateNormalDistribution> trueComponents = new ArrayList<>();
        List<Double> trueWeights = new ArrayList<>();
        
        // 第一个分量 / First component
        IVector<Double> mean1 = Linalg.vector(new double[]{1.0, 2.0});
        IMatrix<Double> cov1 = Linalg.eye(2);
        trueComponents.add(new MultivariateNormalDistribution(mean1, cov1));
        trueWeights.add(0.4);
        
        // 第二个分量 / Second component
        IVector<Double> mean2 = Linalg.vector(new double[]{5.0, 6.0});
        IMatrix<Double> cov2 = Linalg.eye(2);
        trueComponents.add(new MultivariateNormalDistribution(mean2, cov2));
        trueWeights.add(0.6);
        
        GaussianMixtureModel trueGMM = new GaussianMixtureModel(trueComponents, trueWeights);
        
        // 生成训练数据 / Generate training data
        double[][] data = trueGMM.sample(1000);
        
        System.out.println("真实模型参数: / True model parameters:");
        for (int i = 0; i < trueGMM.getNumComponents(); i++) {
            System.out.println("  分量 " + i + " 权重: " + trueWeights.get(i) + " / Component " + i + " weight: " + trueWeights.get(i));
        }
        
        // 使用EM算法估计参数 / Estimate parameters using EM algorithm
        GaussianMixtureModel estimatedGMM = new GaussianMixtureModel(2, 2);
        EMAlgorithm em = new EMAlgorithm();
        List<IVector<Double>> dataList = Arrays.stream(data).map(IVector::of).toList();
        EMAlgorithm.EMResult result = em.fit(dataList, estimatedGMM);
        
        System.out.println("估计结果: / Estimation results:");
        System.out.println("  收敛: " + result.converged + " / Converged: " + result.converged);
        System.out.println("  迭代次数: " + result.iterations + " / Iterations: " + result.iterations);
        
        System.out.println("估计的模型参数: / Estimated model parameters:");
        for (int i = 0; i < estimatedGMM.getNumComponents(); i++) {
            System.out.println("  分量 " + i + " 权重: " + estimatedGMM.getWeights().get(i) + " / Component " + i + " weight: " + estimatedGMM.getWeights().get(i));
        }
    }
    
    public static void demonstrateModelSelection() {
        System.out.println("\n--- 模型选择示例 / Model Selection Example ---");
        
        // 生成测试数据 / Generate test data
        double[][] data = generateTestData();
        
        // 测试不同数量的分量 / Test different numbers of components
        int[] componentCounts = {1, 2, 3, 4, 5};
        double[] logLikelihoods = new double[componentCounts.length];
        List<IVector<Double>> dataList = Arrays.stream(data).map(IVector::of).toList();

        for (int i = 0; i < componentCounts.length; i++) {
            GaussianMixtureModel gmm = new GaussianMixtureModel(componentCounts[i], 2);
            EMAlgorithm em = new EMAlgorithm();
            EMAlgorithm.EMResult result = em.fit(dataList, gmm);
            logLikelihoods[i] = result.logLikelihood;
            
            System.out.println("分量数: " + componentCounts[i] + ", 对数似然: " + logLikelihoods[i] + " / Components: " + componentCounts[i] + ", Log-likelihood: " + logLikelihoods[i]);
        }
        
        // 使用AIC进行模型选择 / Use AIC for model selection
        double[] aicScores = new double[componentCounts.length];
        for (int i = 0; i < componentCounts.length; i++) {
            int k = componentCounts[i] * 6 - 1; // 参数数量 / Number of parameters
            aicScores[i] = 2 * k - 2 * logLikelihoods[i];
        }
        
        int bestModel = 0;
        for (int i = 1; i < aicScores.length; i++) {
            if (aicScores[i] < aicScores[bestModel]) {
                bestModel = i;
            }
        }
        
        System.out.println("最佳模型: " + componentCounts[bestModel] + " 个分量 (AIC = " + aicScores[bestModel] + ") / Best model: " + componentCounts[bestModel] + " components (AIC = " + aicScores[bestModel] + ")");
    }
    
    public static void demonstrateConvergenceAnalysis() {
        System.out.println("\n--- 收敛性分析示例 / Convergence Analysis Example ---");
        
        // 创建测试数据 / Create test data
        double[][] data = generateTestData();
        
        // 使用不同的收敛阈值 / Use different convergence thresholds
        double[] tolerances = {1e-3, 1e-4, 1e-5, 1e-6};
        List<IVector<Double>> dataList = Arrays.stream(data).map(IVector::of).toList();

        for (double tolerance : tolerances) {
            GaussianMixtureModel gmm = new GaussianMixtureModel(3, 2);
            EMAlgorithm em = new EMAlgorithm(1000, tolerance, false, false, 4);
            EMAlgorithm.EMResult result = em.fit(dataList, gmm);
            
            System.out.println("收敛阈值: " + tolerance + ", 迭代次数: " + result.iterations + ", 收敛: " + result.converged + " / Tolerance: " + tolerance + ", Iterations: " + result.iterations + ", Converged: " + result.converged);
        }
    }
    
    private static double[][] generateTestData() {
        // 生成测试数据 / Generate test data
        double[][] data = new double[200][2];
        Random random = new Random(42);
        
        // 两个聚类 / Two clusters
        for (int i = 0; i < 100; i++) {
            data[i][0] = 1.0 + random.nextGaussian() * 0.5;
            data[i][1] = 2.0 + random.nextGaussian() * 0.5;
        }
        
        for (int i = 100; i < 200; i++) {
            data[i][0] = 5.0 + random.nextGaussian() * 0.5;
            data[i][1] = 6.0 + random.nextGaussian() * 0.5;
        }
        
        return data;
    }
}

6.4 实际应用案例 / Real-World Application Cases

public class RealWorldApplicationExample {
    public static void main(String[] args) {
        System.out.println("=== 实际应用案例 / Real-World Application Cases ===");
        
        // 客户细分案例 / Customer segmentation case
        demonstrateCustomerSegmentation();
        
        // 异常检测案例 / Anomaly detection case
        demonstrateAnomalyDetection();
        
        // 图像分割案例 / Image segmentation case
        demonstrateImageSegmentation();
    }
    
    public static void demonstrateCustomerSegmentation() {
        System.out.println("\n--- 客户细分案例 / Customer Segmentation Case ---");
        
        // 模拟客户数据 (年龄, 收入, 消费金额) / Simulate customer data (age, income, spending)
        double[][] customerData = generateCustomerData();
        
        System.out.println("客户数据: " + customerData.length + " 个客户, " + customerData[0].length + " 个特征 / Customer data: " + customerData.length + " customers, " + customerData[0].length + " features");
        
        // 使用GMM进行客户细分 / Use GMM for customer segmentation
        GaussianMixtureModel gmm = new GaussianMixtureModel(4, 3); // 4个客户群体，3个特征
        EMAlgorithm em = new EMAlgorithm();
        List<IVector<Double>> customerList = Arrays.stream(customerData).map(IVector::of).toList();
        EMAlgorithm.EMResult result = em.fit(customerList, gmm);

        // 预测客户群体 / Predict customer segments
        int[] segments = new int[customerData.length];
        for (int i = 0; i < customerData.length; i++) {
            segments[i] = gmm.predictComponent(IVector.of(customerData[i]));
        }
        
        // 分析各群体的特征 / Analyze characteristics of each segment
        System.out.println("客户群体分析: / Customer segment analysis:");
        for (int segment = 0; segment < 4; segment++) {
            List<double[]> segmentData = new ArrayList<>();
            for (int i = 0; i < customerData.length; i++) {
                if (segments[i] == segment) {
                    segmentData.add(customerData[i]);
                }
            }
            
            if (!segmentData.isEmpty()) {
                double[] avgAge = segmentData.stream().mapToDouble(d -> d[0]).average().orElse(0);
                double[] avgIncome = segmentData.stream().mapToDouble(d -> d[1]).average().orElse(0);
                double[] avgSpending = segmentData.stream().mapToDouble(d -> d[2]).average().orElse(0);
                
                System.out.println("  群体 " + segment + ": " + segmentData.size() + " 个客户 / Segment " + segment + ": " + segmentData.size() + " customers");
                System.out.println("    平均年龄: " + avgAge + " / Average age: " + avgAge);
                System.out.println("    平均收入: " + avgIncome + " / Average income: " + avgIncome);
                System.out.println("    平均消费: " + avgSpending + " / Average spending: " + avgSpending);
            }
        }
    }
    
    public static void demonstrateAnomalyDetection() {
        System.out.println("\n--- 异常检测案例 / Anomaly Detection Case ---");
        
        // 生成正常数据和异常数据 / Generate normal and anomalous data
        double[][] normalData = generateNormalData();
        double[][] anomalousData = generateAnomalousData();
        
        // 使用GMM建模正常数据 / Use GMM to model normal data
        GaussianMixtureModel gmm = new GaussianMixtureModel(2, 2);
        EMAlgorithm em = new EMAlgorithm();
        List<IVector<Double>> normalList = Arrays.stream(normalData).map(IVector::of).toList();
        em.fit(normalList, gmm);

        // 计算密度阈值 / Calculate density threshold
        double[] normalDensities = new double[normalData.length];
        for (int i = 0; i < normalData.length; i++) {
            normalDensities[i] = gmm.pdf(IVector.of(normalData[i]));
        }
        double threshold = Arrays.stream(normalDensities).min().orElse(0.0) * 0.1; // 使用10%的密度作为阈值
        
        System.out.println("密度阈值: " + threshold + " / Density threshold: " + threshold);
        
        // 检测异常 / Detect anomalies
        double[] anomalousDensities = new double[anomalousData.length];
        for (int i = 0; i < anomalousData.length; i++) {
            anomalousDensities[i] = gmm.pdf(IVector.of(anomalousData[i]));
        }
        int anomalyCount = 0;
        
        for (int i = 0; i < anomalousData.length; i++) {
            if (anomalousDensities[i] < threshold) {
                anomalyCount++;
                System.out.println("检测到异常: " + Arrays.toString(anomalousData[i]) + " (密度: " + anomalousDensities[i] + ") / Anomaly detected: " + Arrays.toString(anomalousData[i]) + " (density: " + anomalousDensities[i] + ")");
            }
        }
        
        System.out.println("异常检测结果: " + anomalyCount + "/" + anomalousData.length + " 个异常 / Anomaly detection result: " + anomalyCount + "/" + anomalousData.length + " anomalies");
    }
    
    public static void demonstrateImageSegmentation() {
        System.out.println("\n--- 图像分割案例 / Image Segmentation Case ---");
        
        // 模拟图像像素数据 (RGB值) / Simulate image pixel data (RGB values)
        double[][] pixelData = generatePixelData();
        
        System.out.println("图像数据: " + pixelData.length + " 个像素, " + pixelData[0].length + " 个颜色通道 / Image data: " + pixelData.length + " pixels, " + pixelData[0].length + " color channels");
        
        // 使用GMM进行图像分割 / Use GMM for image segmentation
        GaussianMixtureModel gmm = new GaussianMixtureModel(5, 3); // 5个颜色区域，3个RGB通道
        EMAlgorithm em = new EMAlgorithm();
        List<IVector<Double>> pixelList = Arrays.stream(pixelData).map(IVector::of).toList();
        em.fit(pixelList, gmm);

        // 预测像素区域 / Predict pixel regions
        int[] regions = new int[pixelData.length];
        for (int i = 0; i < pixelData.length; i++) {
            regions[i] = gmm.predictComponent(IVector.of(pixelData[i]));
        }
        
        // 分析各区域的颜色特征 / Analyze color characteristics of each region
        System.out.println("图像区域分析: / Image region analysis:");
        for (int region = 0; region < 5; region++) {
            List<double[]> regionData = new ArrayList<>();
            for (int i = 0; i < pixelData.length; i++) {
                if (regions[i] == region) {
                    regionData.add(pixelData[i]);
                }
            }
            
            if (!regionData.isEmpty()) {
                double[] avgR = regionData.stream().mapToDouble(d -> d[0]).average().orElse(0);
                double[] avgG = regionData.stream().mapToDouble(d -> d[1]).average().orElse(0);
                double[] avgB = regionData.stream().mapToDouble(d -> d[2]).average().orElse(0);
                
                System.out.println("  区域 " + region + ": " + regionData.size() + " 个像素 / Region " + region + ": " + regionData.size() + " pixels");
                System.out.println("    平均RGB: (" + avgR + ", " + avgG + ", " + avgB + ") / Average RGB: (" + avgR + ", " + avgG + ", " + avgB + ")");
            }
        }
    }
    
    private static double[][] generateCustomerData() {
        double[][] data = new double[1000][3];
        Random random = new Random(42);
        
        // 生成4个不同的客户群体 / Generate 4 different customer segments
        for (int i = 0; i < 250; i++) {
            data[i][0] = 25 + random.nextGaussian() * 5; // 年龄 / Age
            data[i][1] = 30000 + random.nextGaussian() * 5000; // 收入 / Income
            data[i][2] = 500 + random.nextGaussian() * 100; // 消费 / Spending
        }
        
        for (int i = 250; i < 500; i++) {
            data[i][0] = 35 + random.nextGaussian() * 5;
            data[i][1] = 60000 + random.nextGaussian() * 10000;
            data[i][2] = 1500 + random.nextGaussian() * 300;
        }
        
        for (int i = 500; i < 750; i++) {
            data[i][0] = 45 + random.nextGaussian() * 5;
            data[i][1] = 80000 + random.nextGaussian() * 15000;
            data[i][2] = 3000 + random.nextGaussian() * 500;
        }
        
        for (int i = 750; i < 1000; i++) {
            data[i][0] = 55 + random.nextGaussian() * 5;
            data[i][1] = 100000 + random.nextGaussian() * 20000;
            data[i][2] = 5000 + random.nextGaussian() * 1000;
        }
        
        return data;
    }
    
    private static double[][] generateNormalData() {
        double[][] data = new double[500][2];
        Random random = new Random(42);
        
        for (int i = 0; i < 500; i++) {
            data[i][0] = 5.0 + random.nextGaussian() * 1.0;
            data[i][1] = 5.0 + random.nextGaussian() * 1.0;
        }
        
        return data;
    }
    
    private static double[][] generateAnomalousData() {
        double[][] data = new double[50][2];
        Random random = new Random(123);
        
        for (int i = 0; i < 50; i++) {
            data[i][0] = 10.0 + random.nextGaussian() * 2.0; // 远离正常数据 / Far from normal data
            data[i][1] = 10.0 + random.nextGaussian() * 2.0;
        }
        
        return data;
    }
    
    private static double[][] generatePixelData() {
        double[][] data = new double[10000][3];
        Random random = new Random(42);
        
        // 生成5个不同的颜色区域 / Generate 5 different color regions
        for (int i = 0; i < 2000; i++) {
            data[i][0] = 100 + random.nextGaussian() * 20; // 红色区域 / Red region
            data[i][1] = 50 + random.nextGaussian() * 10;
            data[i][2] = 50 + random.nextGaussian() * 10;
        }
        
        for (int i = 2000; i < 4000; i++) {
            data[i][0] = 50 + random.nextGaussian() * 10; // 绿色区域 / Green region
            data[i][1] = 150 + random.nextGaussian() * 20;
            data[i][2] = 50 + random.nextGaussian() * 10;
        }
        
        for (int i = 4000; i < 6000; i++) {
            data[i][0] = 50 + random.nextGaussian() * 10; // 蓝色区域 / Blue region
            data[i][1] = 50 + random.nextGaussian() * 10;
            data[i][2] = 150 + random.nextGaussian() * 20;
        }
        
        for (int i = 6000; i < 8000; i++) {
            data[i][0] = 200 + random.nextGaussian() * 30; // 黄色区域 / Yellow region
            data[i][1] = 200 + random.nextGaussian() * 30;
            data[i][2] = 50 + random.nextGaussian() * 10;
        }
        
        for (int i = 8000; i < 10000; i++) {
            data[i][0] = 100 + random.nextGaussian() * 20; // 紫色区域 / Purple region
            data[i][1] = 50 + random.nextGaussian() * 10;
            data[i][2] = 150 + random.nextGaussian() * 20;
        }
        
        return data;
    }
}

学习路径建议 / Learning Path Recommendations

初学者路径 / Beginner Path

从第一部分开始，掌握基本统计量计算 / Start with Part 1, master basic statistical calculations
理解正态分布和均匀分布的基本概念 / Understand basic concepts of normal and uniform distributions
学习简单的随机采样和概率计算 / Learn simple random sampling and probability calculations

中级用户路径 / Intermediate Path

掌握t分布、卡方分布、F分布等统计分布 / Master statistical distributions like t-distribution, chi-squared, F-distribution
学习参数估计和假设检验方法 / Learn parameter estimation and hypothesis testing methods
理解不同分布的应用场景 / Understand application scenarios of different distributions

高级用户路径 / Advanced Path

掌握复杂的统计分析方法 / Master complex statistical analysis methods
学习实际业务场景的应用 / Learn applications in real business scenarios
理解统计推断的原理和实践 / Understand principles and practice of statistical inference

专业用户路径 / Professional Path

掌握蒙特卡洛模拟等高级方法 / Master advanced methods like Monte Carlo simulation
能够设计复杂的统计分析方案 / Be able to design complex statistical analysis solutions
能够处理实际业务中的复杂统计问题 / Be able to handle complex statistical problems in real business

总结 / Summary

本文档按照从简单到复杂的顺序，系统性地介绍了统计操作包的各种功能。通过循序渐进的学习，您可以：

This document systematically introduces various functions of the statistics package in order from simple to complex. Through progressive learning, you can:

掌握基础：从基本统计量开始，逐步建立统计基础 / Master the basics: Start with basic statistics and gradually build statistical foundations
应用实践：通过实际案例学习不同统计方法的使用场景 / Apply in practice: Learn usage scenarios of different statistical methods through real cases
进阶提升：掌握高级统计方法和专业应用 / Advance and improve: Master advanced statistical methods and professional applications
灵活运用：根据实际需求选择合适的统计分析方法 / Use flexibly: Choose appropriate statistical analysis methods based on actual needs

新增功能亮点 / New Feature Highlights

方差分析 (ANOVA)：完整的单因素、两因素和重复测量方差分析功能 / Analysis of Variance (ANOVA): Complete one-way, two-way, and repeated measures ANOVA functionality
假设检验：正态性检验和方差齐性检验 / Assumption Testing: Normality tests and homogeneity of variance tests
多重比较：Tukey HSD多重比较方法 / Multiple Comparisons: Tukey HSD multiple comparison methods
中英文对照：完整的双语文档支持 / Bilingual Support: Complete bilingual documentation support

统计操作示例 - 让统计分析更简单！

Statsistics Examples - Make statistical analysis simpler!

FilesExpand file tree

Statistics-Examples.md

Latest commit

History