Finished a good part of analysis and figure for Thresh-LP invariance (WIP).

2026-03-06 14:47:22 +01:00
parent 933d28b5f8
commit 0407053c20
15 changed files with 774 additions and 338 deletions
--- a/python/save_inv_data_log-hp.py
+++ b/python/save_inv_data_log-hp.py
@@ -1,7 +1,5 @@
-import plotstyle_plt
 import glob
 import numpy as np
-import matplotlib.pyplot as plt
 from thunderhopper.modeltools import load_data, save_data
 from thunderhopper.filetools import crop_paths
 from thunderhopper.filters import decibel, sosfilter
@@ -14,111 +12,73 @@ data_paths = glob.glob(f'../data/processed/{target}*.npz')
 save_path = '../data/inv/log_hp/'

 # ANALYSIS SETTINGS:
-scales = np.arange(0, 10.1, 0.1)
-save_scales = np.array([0, 0.5, 1, 2, 5, 10])
-floor_percents = dict(song=100, noise=99)
+add_noise = False
 single_db_ref = True
-plot_redundant = False
+# find_saturation = add_noise and False
+example_scales = np.array([0, 0.1, 1, 10, 100, 200])
+scales = np.geomspace(0.1, 1000, 100)
+if not add_noise:
+    example_scales = example_scales[example_scales > 0]
+scales = np.unique(np.concatenate((scales, example_scales)))
+# if find_saturation:
+#     scales = np.append(scales, 10e10)

 # EXECUTION:
 for data_path, name in zip(data_paths, crop_paths(data_paths)):
    print(f'Processing {name}')

-    # Load song envelope:
+    # Get normalized song envelope:
    data, config = load_data(data_path, files='env')
    song, rate = data['env'], config['env_rate']
-    t_full = np.arange(song.shape[0]) / rate
-
-    # Generate noise envelope:
-    rng = np.random.default_rng()
-    noise = rng.normal(size=song.shape)
-    noise = extract_env(noise, rate, config=config)
-
-    # Normalize each:
    song /= song.std()
-    noise /= noise.std()

-    # Mix song component and noise component:
-    scaled = song[:, None] * scales[None, :]
-    mix = scaled + noise[:, None]
+    # Rescale song component:
+    mix = song[:, None] * scales[None, :]

-    # Find noise floor (experimental):
-    song_percent = np.percentile(scaled, floor_percents['song'], axis=0)
-    noise_percent = np.percentile(noise, floor_percents['noise'])
-    floor_scale = scales[np.nonzero(song_percent <= noise_percent)[0][-1]]
+    if add_noise:
+        # Add normalized noise envelope:
+        rng = np.random.default_rng()
+        noise = rng.normal(size=song.shape)
+        noise = extract_env(noise, rate, config=config)
+        noise /= noise.std()
+        mix += noise[:, None]

    # Process mixture:
    mix_log = decibel(mix, axis=None if single_db_ref else 0)
    mix_inv = sosfilter(mix_log, rate, config['inv_fcut'], 'hp',
                        padtype='constant', padlen=config['padlen'])

-    # Get variances per stage:
-    var_env = mix.var(axis=0)
-    var_log = mix_log.var(axis=0)
-    var_inv = mix_inv.var(axis=0)
+    # Get "intensity measure" per stage:
+    measure_env = mix.std(axis=0)
+    measure_log = mix_log.std(axis=0)
+    measure_inv = mix_inv.std(axis=0)

-    # Get SNRs against pure noise per stage:
-    base_ind = np.nonzero(scales == 0)[0][0]
-    snr_env = var_env / var_env[base_ind]
-    snr_log = var_log / var_log[base_ind]
-    snr_inv = var_inv / var_inv[base_ind]
-
-    if plot_redundant:
-        # Normalize SNRs:
-        norm_snr_env = snr_env / snr_env.max()
-        norm_snr_log = snr_log / snr_log.max()
-        norm_snr_inv = snr_inv / snr_inv.max()
-
-        # Get SNR gain against env:
-        gain_log = snr_log / snr_env
-        gain_inv = snr_inv / snr_env
-
-        # Plot results:
-        fig, axes = plt.subplots(6, 1, sharex=True, layout='constrained')
-        
-        axes[0].set_title('variance')
-        axes[0].plot(scales, var_env)
-        axes[0].plot(scales, var_log)
-        axes[0].plot(scales, var_inv)
-
-        axes[1].set_title('normalized variance')
-        axes[1].plot(scales, var_env / var_env.max())
-        axes[1].plot(scales, var_log / var_log.max())
-        axes[1].plot(scales, var_inv / var_inv.max())
-
-        axes[2].set_title('SNR')
-        axes[2].plot(scales, snr_env)
-        axes[2].plot(scales, snr_log)
-        axes[2].plot(scales, snr_inv)
-
-        axes[3].set_title('normalized SNR')
-        axes[3].plot(scales, norm_snr_env)
-        axes[3].plot(scales, norm_snr_log)
-        axes[3].plot(scales, norm_snr_inv)
-
-        axes[4].set_title('gain (absolute SNR)')
-        axes[4].plot(scales, gain_log)
-        axes[4].plot(scales, gain_inv)
-
-        axes[5].set_title('gain (normalized SNR)')
-        axes[5].plot(scales, norm_snr_log / norm_snr_env)
-        axes[5].plot(scales, norm_snr_inv / norm_snr_env)
-        plt.show()
+    # # Find saturation level:
+    # if find_saturation:
+    #     limit = measure_inv[-1]
+    #     scales = scales[:-1]
+    #     measure_env = measure_env[:-1]
+    #     measure_log = measure_log[:-1]
+    #     measure_inv = measure_inv[:-1]

    # Save analysis results:
-    save_inds = np.isin(scales, save_scales)
+    save_inds = np.nonzero(np.isin(scales, example_scales))[0]
    if save_path is not None:
        data = dict(
            scales=scales,
-            plot_scales=scales[save_inds],
-            floor_scale=floor_scale,
+            example_scales=example_scales,
            env=mix[:, save_inds],
            log=mix_log[:, save_inds],
            inv=mix_inv[:, save_inds],
-            snr_env=snr_env,
-            snr_log=snr_log,
-            snr_inv=snr_inv,
+            measure_env=measure_env,
+            measure_log=measure_log,
+            measure_inv=measure_inv,
            )
-        save_data(save_path + name, data, config, overwrite=True)
+        # if find_saturation:
+        #     data['limit'] = limit
+        file_name = save_path + name
+        if add_noise:
+            file_name += '_noise'
+        save_data(file_name, data, config, overwrite=True)
 print('Done.')
 embed()