GitHub Repository: probml/pyprobml
Path: blob/master/notebooks/book2/09/supplementary/discretized_ssm.ipynb
²³⁰¹ views

Kernel: Python 3

Inference in a discretized 1d SSM

This script implements algorithms and examples for inference in a state space model with a real-valued scalar hidden state and a real-valued scalar observation. The basic method is based on discretization and the HMM smoother; a novel method is also derived based on KDE for the case where the likelihood cannot be evaluated pointwise. For details see this paper.

"Computation and visualization of posterior densities in scalar nonlinear and non-Gaussian Bayesian filtering and smoothing problems", Michael Roth and Fredrik Gustafsson Reference: https://liu.diva-portal.org/smash/get/diva2:1173608/FULLTEXT02.pdf Part of: 2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 2017, pp. 4686-4690. ISBN: 978-1-5090- 4117-6 Book Series: International Conference on Acoustics Speech and Signal Processing ICASSP, 1520-6149.

Original matlab code: http://users.isy.liu.se/en/rt/roth/rothICASSP2017.zip

Converted to JAX by benlau6 https://github.com/probml/pyprobml/pull/700

Setup

In [1]:

from typing import Callable
import functools

import jax
from jax import lax
from jax import numpy as jnp
from jax import scipy as jsp
from jax import random
import matplotlib.pyplot as plt


plt.rcParams.update({"font.size": 16})

In [2]:

def generate_x_true(rng_key: jnp.DeviceArray, max_iter: int, x0_rvs: Callable, v_rvs: Callable, f: Callable):
    def get_next_x_true(x_prev, k, v):
        x_true = f(x_prev, v[k - 1], k=k - 1)
        return x_true, x_true

    rng_keys = random.split(rng_key, num=2)
    x0 = x0_rvs(rng_keys[0], shape=())
    v = v_rvs(rng_keys[1], shape=(max_iter + 1,))

    get_next_x_true_func = functools.partial(get_next_x_true, v=v)
    _, x_true = lax.scan(get_next_x_true_func, init=x0, xs=jnp.arange(1, max_iter + 1))
    return jnp.array([x0, *x_true])


def generate_y(rng_key: jnp.DeviceArray, x_true: jnp.DeviceArray, e_rvs: Callable, h: Callable):
    shape = x_true.shape
    e = e_rvs(rng_key, shape=shape)
    y = h(x_true, e)
    y = y.at[0].set(jnp.inf)
    return y


def x_pdf(x_new, x, k, v_pdf, f):
    v = f(x=x, v=0, k=k)
    return v_pdf(x_new - v)


def y_likelihood(y, x, e_pdf, h):
    e = h(x=x, e=0)
    return e_pdf(y - e)


def point_mass_density(
    y: jnp.DeviceArray,
    x_grid: jnp.DeviceArray,
    x0_pdf: Callable,
    x_pdf: Callable,
    v_pdf: Callable,
    e_pdf: Callable,
    f: Callable,
    h: Callable,
):
    num_grid_points = x_grid.shape[0]
    max_iter = len(y) - 1
    delta = x_grid[1] - x_grid[0]
    X = jnp.tile(x_grid, (num_grid_points, 1))

    p_filter0 = x0_pdf(x_grid)
    p_filter0 /= jnp.sum(p_filter0)
    p_pred0 = [jnp.inf] * num_grid_points

    def get_next_filter_pred_densities(p_filter_prev, k, x_grid, X, y):
        # p(xk, xk-1 | y(1:k-1))
        px = x_pdf(k=k - 1, x_new=X.T, x=X, v_pdf=v_pdf, f=f)
        p_joint = px * p_filter_prev

        # p(xk | y(1:k-1))
        p_pred_k = jnp.sum(p_joint, axis=1)
        p_pred_k /= jnp.sum(p_pred_k)

        # p(xk | y(1:k))
        p_filter_k = p_pred_k * y_likelihood(y[k], x_grid, e_pdf, h)
        p_filter_k /= jnp.sum(p_filter_k)
        return p_filter_k, [p_filter_k, p_pred_k]

    get_next_filter_pred_densities_func = functools.partial(get_next_filter_pred_densities, x_grid=x_grid, X=X, y=y)

    _, (p_filter, p_pred) = lax.scan(
        get_next_filter_pred_densities_func,
        init=p_filter0,
        xs=jnp.arange(1, max_iter + 1),
    )
    p_filter = jnp.array([p_filter0, *p_filter])
    p_pred = jnp.array([p_pred0, *p_pred])

    p_smooth_max_iter = jnp.array(p_filter[max_iter].copy())

    def get_next_smooth_density(p_smooth_prev, k, X, p_filter, p_pred):
        # p(xk, xk-1 | y(1:k-1))
        px = x_pdf(k=k, x_new=X, x=X.T, v_pdf=v_pdf, f=f)
        px = px * p_smooth_prev / p_pred[k + 1, :]
        px = jnp.nan_to_num(px)

        p_smooth_k = jnp.sum(px, axis=1)  # marginalize
        p_smooth_k *= p_filter[k, :]  # multiply p(xk|yk)
        p_smooth_k /= jnp.sum(p_smooth_k)
        return p_smooth_k, p_smooth_k

    get_next_smooth_density_func = functools.partial(
        get_next_smooth_density,
        X=X,
        p_filter=p_filter,
        p_pred=p_pred,
    )
    _, p_smooth = lax.scan(
        get_next_smooth_density_func, init=p_smooth_max_iter, xs=jnp.arange(0, max_iter), reverse=True
    )
    p_smooth = jnp.array([*p_smooth, p_smooth_max_iter])

    return p_filter / delta, p_pred / delta, p_smooth / delta


def plot_density(
    x_true,
    y,
    inv_h,
    x_grid,
    p_pred,
    p_filter,
    p_smooth=None,
    k=1,
    legend=True,
    ax=None,
    vfill=None,
    title="",
    linewidth=4.5,
):
    if ax is None:
        fig, ax = plt.subplots(figsize=(12, 8))

    ax.plot(x_grid, p_pred[k], label="Prediction", linewidth=linewidth)
    ax.plot(x_grid, p_filter[k], label="Filtering", color="k", linewidth=linewidth)
    if p_smooth is not None:
        ax.plot(x_grid, p_smooth[k], label="Smoothing", color="orange", linewidth=linewidth)

    y_max = max(p_pred[k].max(), p_filter[k].max()) * 1.05
    if p_smooth is not None:
        y_max = max(y_max, p_smooth[k].max()) * 1.05
    ax.vlines([x_true[k]], ymin=0, ymax=y_max, label="True state", color="k")
    ax.vlines(
        inv_h(y[k]),
        ymin=0,
        ymax=y_max,
        color="r",
        label="Measurement",
    )
    if vfill is not None:
        ax.axvspan(*vfill, color="lightgrey", alpha=0.4, label="Measurement range")
    ax.set_ylim(0)
    ax.set_ylabel(f"$p(x_{{{k}}}|y_{{1:{k}}})$")
    ax.set_xlabel("x")
    if legend:
        ax.legend(prop={"size": 16})
    if title:
        ax.set_title(title)


def plot_densities(x_true, y, inv_h, x_grid, p_pred, p_filter, p_smooth, max_iter, legend=True, nrow=None, ncol=None):
    if (nrow is None) or (ncol is None):
        raise ValueError("Please provide nrow and ncol arguments")

    fig, axes = plt.subplots(nrow, ncol, figsize=(12, 6), sharex=True, sharey=True, constrained_layout=True)
    axes = axes.ravel()

    plt.suptitle("All density plots to look for weird pattern")

    for k in range(1, nrow * ncol):
        plot_density(
            x_true,
            y,
            inv_h,
            x_grid=x_grid,
            p_pred=p_pred,
            p_filter=p_filter,
            p_smooth=p_smooth,
            k=k,
            ax=axes[k],
            legend=False,
            linewidth=1.5,
        )

    # set off k=0 empty plot and attach legend
    axes[0].axis("off")
    handles, labels = axes[1].get_legend_handles_labels()
    fig.legend(handles, labels, loc="upper left")


def experiment_setup(
    rng_key, grid_minval, grid_maxval, num_grid_points, x0_rvs, v_rvs, e_rvs, f, h, max_iter, plot_xy=False
):
    # create 1d grid
    x_grid = jnp.linspace(grid_minval, grid_maxval, num_grid_points)

    # generate true states
    rng_key, rng_subkey = random.split(rng_key)
    x_true = generate_x_true(
        rng_subkey,
        max_iter=max_iter,
        x0_rvs=x0_rvs,
        v_rvs=v_rvs,
        f=f,
    )

    # generate measurement
    rng_key, rng_subkey = random.split(rng_key)
    y = generate_y(rng_subkey, x_true, e_rvs=e_rvs, h=h)

    if plot_xy:
        # plot trajectory and the measurement
        fig, ax = plt.subplots(figsize=(12, 8))
        ax.set_title("Trajectory and Measurement versus k")
        ax.plot(range(max_iter + 1), x_true, label="True state", color="k")
        ax.plot(range(max_iter + 1), y, label="Measurements", color="r")
        ax.set_ylabel("$x_k, y_k$")
        ax.set_xlabel("k")
        ax.legend(prop={"size": 16})

    return x_grid, x_true, y


def mean_point_mass(xs, ps):
    delta = xs[1] - xs[0]
    return jnp.sum(xs * ps * delta, axis=1)


def variance_point_mass(xs, ps):
    delta = xs[1] - xs[0]
    return jnp.sum((xs**2) * ps * delta, axis=1) - mean_point_mass(xs, ps) ** 2


def plot_line(x_true, y, mean_x_filter, variance_x_filter, max_iter, mean_x_smooth=None, variance_x_smooth=None):
    # To plot x, y, and variance
    plt.figure(figsize=(12, 8))
    plt.plot(x_true, label="true", color="k")
    plt.plot(y, label="observed", color="r")

    plt.errorbar(
        range(max_iter + 1),
        mean_x_filter,
        yerr=jnp.sqrt(variance_x_filter),
        label="filtered mean",
    )

    if (mean_x_smooth is not None) and (variance_x_smooth is not None):
        plt.errorbar(
            range(max_iter + 1),
            mean_x_smooth,
            yerr=jnp.sqrt(variance_x_smooth),
            label="smoothed mean",
        )
    plt.legend()
    plt.title("States versus time")
    plt.xlabel("time")
    plt.ylabel("value")
    plt.xticks(range(max_iter + 1))


def val2grid(x, grid_minval, grid_maxval, num_grid_points):
    return (x - grid_minval) / (grid_maxval - grid_minval) * num_grid_points


def plot_heatmap(density, x_true, grid_minval, grid_maxval, num_grid_points, max_iter, title=""):
    # Plot heatmat to capture multi-modality
    fig, ax = plt.subplots(figsize=(12, 8))

    heatmap = ax.imshow(density.T, aspect="auto", interpolation="none")
    ax.title.set_text(title)

    xticks = range(max_iter + 1)
    yticks = jnp.arange(0, num_grid_points, num_grid_points / 6)
    ytick_labels = x_grid[yticks.astype(int)].round().astype(int)
    plt.xticks(xticks)
    plt.yticks(yticks, labels=ytick_labels)

    x_true_ticks = val2grid(x_true, grid_minval, grid_maxval, num_grid_points)
    p_actual = jnp.zeros((max_iter + 1, num_grid_points))
    p_actual = jax.vmap(lambda x, y: x.at[y].set(1))(p_actual, x_true_ticks.round().astype(int))
    p_actual = p_actual

    ax.set_xticks(jnp.arange(-0.5, max_iter + 1, 1), minor=True)
    ax.grid(which="minor", color="w", linewidth=2)
    plt.colorbar(heatmap, ax=ax, fraction=0.04, pad=0.04)

    for x, y in zip(xticks, x_true_ticks.round().astype(int)):
        ax.text(x, y, "X", ha="center", va="center", color="red", fontsize=18)

Non-linear, Gaussian example (the "Particle filter" example in 5.1)

In [3]:

# functions for the particle filter example

# state transition function
def state_trans_func1(x, v, k):
    return x / 2 + 25 * x / (1 + x**2) + 8 * jnp.cos(1.2 * (k + 1)) + v


# measurement function
def measure_func1(x, e):
    return x**2 / 20 + e


# to get x from measurement without noise
def inv_measure_func1(y):
    x = jnp.sqrt(20 * y)
    return [x, -x]


# functions to get sample
def v_rvs1(rng_key, shape):
    return random.normal(rng_key, shape=shape) * jnp.sqrt(10)


def e_rvs1(rng_key, shape):
    return random.normal(rng_key, shape=shape)


def x0_rvs1(rng_key, shape):
    return random.normal(rng_key, shape=shape)


# functions to get density
v_pdf1 = functools.partial(jsp.stats.norm.pdf, scale=jnp.sqrt(10))
e_pdf1 = functools.partial(jsp.stats.norm.pdf, scale=1)
x0_pdf1 = jsp.stats.norm.pdf

Out[3]:

WARNING:absl:No GPU/TPU found, falling back to CPU. (Set TF_CPP_MIN_LOG_LEVEL=0 and rerun for more info.)

In [4]:

def the_particle_filter_example(
    rng_key=random.PRNGKey(4), grid_minval=-30, grid_maxval=30, num_grid_points=500, max_iter=20, iter_=14
):
    # generate data points and densities
    x_grid, x_true, y = experiment_setup(
        rng_key=rng_key,
        grid_minval=grid_minval,
        grid_maxval=grid_maxval,
        num_grid_points=num_grid_points,
        x0_rvs=x0_rvs1,
        v_rvs=v_rvs1,
        e_rvs=e_rvs1,
        f=state_trans_func1,
        h=measure_func1,
        max_iter=max_iter,
    )

    p_filter, p_pred, p_smooth = point_mass_density(
        y,
        x_grid,
        x0_pdf1,
        x_pdf=x_pdf,
        v_pdf=v_pdf1,
        e_pdf=e_pdf1,
        f=state_trans_func1,
        h=measure_func1,
    )

    return x_grid, x_true, y, p_filter, p_pred, p_smooth

In [5]:

rng_key = random.PRNGKey(8)
grid_minval = -30
grid_maxval = 30
num_grid_points = 500
max_iter = 20
iter_ = 17
x_grid, x_true, y, p_filter, p_pred, p_smooth = the_particle_filter_example(
    rng_key=rng_key,
    grid_minval=grid_minval,
    grid_maxval=grid_maxval,
    num_grid_points=num_grid_points,
    max_iter=max_iter,
    iter_=iter_,
)

In [6]:

print(y)
print(x_true)
print(p_filter.shape)

Out[6]:

[        inf  1.4119194   9.778312   13.731533    0.08087747  0.9718474
  3.6153007   6.611553    9.545688    5.817633   -0.31509346  1.8706486
 17.051289   22.01199    13.182387    6.2407303  -1.9377167   7.1829915
  8.261231    8.400024    0.20307924]
[ -0.4561126  -7.605457  -13.337379  -17.322739   -2.3931375  -3.851975
  -6.607283  -10.273396  -13.388312  -10.561915   -1.3715553  -5.607362
 -17.723421  -21.158405  -16.464176  -10.073148   -2.726372  -12.516108
 -13.304679  -12.497812   -2.011444 ]
(21, 500)

In [7]:

# plot the kth density
plot_density(
    x_true,
    y,
    inv_measure_func1,
    x_grid,
    p_pred,
    p_filter,
    p_smooth,
    k=17,
    legend=True,
    ax=None,
    title=f"Particle filter example densities at $x_{{{iter_}}}$",
)

Out[7]:

In [8]:

# filtered mean E[x(k) | y(1:k)]
mean_x_filter = mean_point_mass(x_grid, p_filter)
# variance +- sqrt{Var[x(k)|y(1:k)}
variance_x_filter = variance_point_mass(x_grid, p_filter)

# smoothed mean E[x(k) | y(1:T)]
mean_x_smooth = mean_point_mass(x_grid, p_smooth)
# variance +- sqrt{Var[x(k)|y(1:T)}, as a line plot
variance_x_smooth = variance_point_mass(x_grid, p_smooth)

# To plot x, y, and variance
plot_line(
    x_true,
    y,
    mean_x_filter,
    variance_x_filter,
    max_iter,
    mean_x_smooth=mean_x_smooth,
    variance_x_smooth=variance_x_smooth,
)

Out[8]:

In [9]:

# Plot heatmap to capture multi-modality
plot_heatmap(p_filter, x_true, grid_minval, grid_maxval, num_grid_points, max_iter, title="Filtered density heatmap")

plot_heatmap(p_smooth, x_true, grid_minval, grid_maxval, num_grid_points, max_iter, title="Smoothed density heatmap")

Out[9]:

In [10]:

# looking for weird density plot by plotting all max_iter densities
plot_densities(
    x_true,
    y,
    inv_measure_func1,
    x_grid,
    p_pred,
    p_filter,
    p_smooth,
    max_iter,
    nrow=4,
    ncol=5,
)

Out[10]:

Linear Gaussian dynamics, Student-t observations (5.2)

In [11]:

# functions for student t random walk example

# state transition function
def state_trans_func2(x, v, k=None):
    return x + v


# measurement function
def measure_func2(x, e):
    return x + e


# to get x from measurement without noise
def inv_measure_func2(y):
    return y


# functions to get sample
def v_rvs2(rng_key, shape):
    return random.t(rng_key, df=2, shape=shape)


def e_rvs2(rng_key, shape):
    return random.t(rng_key, df=2, shape=shape)


def x0_rvs2(rng_key, shape):
    return random.t(rng_key, df=2, shape=shape)


# functions to get density
pdf2 = functools.partial(jsp.stats.t.pdf, df=2)
v_pdf2 = pdf2
e_pdf2 = pdf2
x0_pdf2 = pdf2


def student_t_random_walk_example(
    rng_key=random.PRNGKey(0), grid_minval=-60, grid_maxval=30, num_grid_points=500, max_iter=25, iter_=22
):
    # generate data points and densities
    x_grid, x_true, y = experiment_setup(
        rng_key=rng_key,
        grid_minval=grid_minval,
        grid_maxval=grid_maxval,
        num_grid_points=num_grid_points,
        x0_rvs=x0_rvs2,
        v_rvs=v_rvs2,
        e_rvs=e_rvs2,
        f=state_trans_func2,
        h=measure_func2,
        max_iter=max_iter,
    )

    p_filter, p_pred, p_smooth = point_mass_density(
        y,
        x_grid,
        x0_pdf2,
        x_pdf=x_pdf,
        v_pdf=v_pdf2,
        e_pdf=e_pdf2,
        f=state_trans_func2,
        h=measure_func2,
    )

    return x_grid, x_true, y, p_filter, p_pred, p_smooth

In [12]:

rng_key = random.PRNGKey(1)
grid_minval = -20
grid_maxval = 20
num_grid_points = 500
max_iter = 25
iter_ = 20
x_grid, x_true, y, p_filter, p_pred, p_smooth = student_t_random_walk_example(
    rng_key=rng_key,
    grid_minval=grid_minval,
    grid_maxval=grid_maxval,
    num_grid_points=num_grid_points,
    max_iter=max_iter,
    iter_=iter_,
)

In [13]:

plot_density(
    x_true,
    y,
    inv_measure_func2,
    x_grid,
    p_pred,
    p_filter,
    p_smooth,
    k=iter_,
    legend=True,
    ax=None,
    title=f"Student's t random walk example densities at $x_{{{iter_}}}$",
)

Out[13]:

In [14]:

# filtered mean E[x(k) | y(1:k)]
mean_x_filter = mean_point_mass(x_grid, p_filter)
# variance +- sqrt{Var[x(k)|y(1:k)}
variance_x_filter = variance_point_mass(x_grid, p_filter)

# smoothed mean E[x(k) | y(1:T)]
mean_x_smooth = mean_point_mass(x_grid, p_smooth)
# variance +- sqrt{Var[x(k)|y(1:T)}, as a line plot
variance_x_smooth = variance_point_mass(x_grid, p_smooth)

# To plot x, y, and variance
plot_line(
    x_true,
    y,
    mean_x_filter,
    variance_x_filter,
    max_iter,
    mean_x_smooth=mean_x_smooth,
    variance_x_smooth=variance_x_smooth,
)

Out[14]:

In [15]:

# Plot heatmap to capture multi-modality
plot_heatmap(p_filter, x_true, grid_minval, grid_maxval, num_grid_points, max_iter, title="Filtered density heatmap")

plot_heatmap(p_smooth, x_true, grid_minval, grid_maxval, num_grid_points, max_iter, title="Smoothed density heatmap")

Out[15]:

Saturated measurement with intractable likelihood (sec 5.3)

In [16]:

def inversion_sampling(rng_key, x_grid, px_grid, num_samples):
    rng_keys = random.split(rng_key, num=2)
    u = random.uniform(rng_keys[0], shape=(num_samples, 1))
    delta = x_grid[1] - x_grid[0]
    noise = random.uniform(rng_keys[1], minval=-delta / 2, maxval=delta / 2, shape=(num_samples,))
    # It only works for sufficient dense uniformly spaced grid
    point_mass = px_grid

    cdf = jnp.cumsum(point_mass)

    bound_cdf = jnp.where(cdf < u, cdf, 0)
    idx = jnp.argmax(bound_cdf, axis=1)
    x = x_grid[idx]
    return x + noise


def kde(x_grid, x, kernel_variance):
    delta = x_grid[1] - x_grid[0]
    # broadcast it into (n_x_grid, nx)
    x_grid = jnp.tile(x_grid[..., jnp.newaxis], (1, x.shape[0]))
    px = jsp.stats.norm.pdf(x_grid, loc=x, scale=kernel_variance)
    px = jnp.sum(px, axis=1)
    px = px / jnp.sum(px) / delta
    return px


def novel_density(
    rng_key: jnp.DeviceArray,
    y: jnp.DeviceArray,
    x_grid: jnp.DeviceArray,
    x0_pdf: Callable,
    v_rvs: Callable,
    e_rvs: Callable,
    f: Callable,
    h: Callable,
    num_samples: int,
    max_iter: int,
    kernel_variance: float,
):
    num_grid_points = x_grid.shape[0]
    delta = x_grid[1] - x_grid[0]

    rng_keys = random.split(rng_key, num=3)
    v = v_rvs(rng_keys[0], shape=(max_iter + 1, num_samples))
    e = e_rvs(rng_keys[1], shape=(max_iter + 1, num_samples))

    p_filter0 = x0_pdf(x_grid)
    p_filter0 /= jnp.sum(p_filter0)
    p_pred0 = [jnp.inf] * num_grid_points

    def get_next_novel_density(p_filter_prev, k, x_grid, v, e, y_measured, num_samples, kernel_variance, rng_key):
        x = inversion_sampling(rng_key, x_grid, p_filter_prev, num_samples)
        x = f(x, v[k], k - 1)

        # p(xk | y(1:k-1))
        p_pred_k = kde(x_grid, x, kernel_variance)
        p_pred_k /= jnp.sum(p_pred_k)

        # measurement
        y = h(x, e[k])

        # p(xk | y(1:k))
        threshold = 3 * jnp.sqrt(kernel_variance)
        distance = jnp.abs(y_measured[k] - y)

        def update(xi, yi, distance_i):
            return jnp.where(
                distance_i < threshold,
                jsp.stats.norm.pdf(x_grid, xi, kernel_variance) * jsp.stats.norm.pdf(y[k], yi, kernel_variance),
                0,
            )

        update_vals = jax.vmap(update)(x, y, distance)
        p_filter_k = jnp.sum(update_vals, axis=0)
        p_filter_k /= jnp.sum(p_filter_k)
        return p_filter_k, [p_filter_k, p_pred_k]

    get_next_novel_density_func = functools.partial(
        get_next_novel_density,
        x_grid=x_grid,
        v=v,
        e=e,
        y_measured=y,
        num_samples=num_samples,
        kernel_variance=kernel_variance,
        rng_key=rng_keys[2],
    )

    _, (p_filter, p_pred) = lax.scan(get_next_novel_density_func, init=p_filter0, xs=jnp.arange(1, max_iter + 1))
    p_filter = jnp.array([p_filter0, *p_filter])
    p_pred = jnp.array([p_pred0, *p_pred])
    return p_filter / delta, p_pred / delta

In [17]:

# functions for saturated measurements example

# state transition function
def state_trans_func3(x, v, k=None):
    return 0.7 * x + v


# measurement function
def saturate(x, minval, maxval):
    return jnp.maximum(jnp.minimum(x, maxval), minval)


def measure_func3(x, e, minval=-1.5, maxval=1.5):
    return saturate(x + e, minval=minval, maxval=maxval)


# to get x from measurement without noise
def inv_measure_func3(y):
    return y


# functions to get sample
def v_rvs3(rng_key, shape):
    return random.normal(rng_key, shape=shape)


def e_rvs3(rng_key, shape):
    return random.normal(rng_key, shape=shape) * jnp.sqrt(0.5)


def x0_rvs3(rng_key, shape):
    return random.normal(rng_key, shape=shape) * jnp.sqrt(0.1)


# functions to get density
x0_pdf3 = functools.partial(jsp.stats.norm.pdf, scale=jnp.sqrt(0.1))


def saturated_measurements_example(
    rng_key=random.PRNGKey(0),
    num_samples=10000,
    grid_minval=-6,
    grid_maxval=6,
    num_grid_points=500,
    max_iter=24,
    iter_=18,
):
    # generate data points and densities
    rng_key, subkey = random.split(rng_key, num=2)
    x_grid, x_true, y = experiment_setup(
        rng_key=rng_key,
        grid_minval=grid_minval,
        grid_maxval=grid_maxval,
        num_grid_points=num_grid_points,
        x0_rvs=x0_rvs3,
        v_rvs=v_rvs3,
        e_rvs=e_rvs3,
        f=state_trans_func3,
        h=measure_func3,
        max_iter=max_iter,
    )

    p_filter, p_pred = novel_density(
        subkey,
        y,
        x_grid,
        x0_pdf3,
        v_rvs3,
        e_rvs3,
        state_trans_func3,
        measure_func3,
        num_samples,
        max_iter,
        kernel_variance=0.15,
    )
    p_smooth = None

    return x_grid, x_true, y, p_filter, p_pred, p_smooth

In [18]:

rng_key = rng_key = random.PRNGKey(0)
num_samples = 10000
grid_minval = -6
grid_maxval = 6
num_grid_points = 500
max_iter = 24
iter_ = 18
x_grid, x_true, y, p_filter, p_pred, p_smooth = saturated_measurements_example(
    rng_key=rng_key,
    num_samples=num_samples,
    grid_minval=grid_minval,
    grid_maxval=grid_maxval,
    num_grid_points=num_grid_points,
    max_iter=max_iter,
    iter_=iter_,
)

In [19]:

plot_density(
    x_true,
    y,
    inv_measure_func3,
    x_grid,
    p_pred,
    p_filter,
    p_smooth,
    k=iter_,
    legend=True,
    ax=None,
    title=f"Saturated measurements example densities at $x_{{{iter_}}}$",
)

Out[19]:

In [20]:

# filtered mean E[x(k) | y(1:k)]
mean_x_filter = mean_point_mass(x_grid, p_filter)
# variance +- sqrt{Var[x(k)|y(1:k)}
variance_x_filter = variance_point_mass(x_grid, p_filter)

# To plot x, y, and variance
plot_line(
    x_true,
    y,
    mean_x_filter,
    variance_x_filter,
    max_iter,
)

Out[20]:

In [21]:

# Plot heatmap to capture multi-modality
plot_heatmap(p_filter, x_true, grid_minval, grid_maxval, num_grid_points, max_iter, title="Filtered density heatmap")

Out[21]:

Inference in a discretized 1d SSM

Setup

Non-linear, Gaussian example (the "Particle filter" example in 5.1)

Linear Gaussian dynamics, Student-t observations (5.2)

Saturated measurement with intractable likelihood (sec 5.3)

Product

Resources

Company