Liberarsi dai valori codificati: strategie più intelligenti per il software moderno

IN-COM 3 Giugno 2026 Gestione dei dati, Software di analisi dell'impatto, Tech Talk

I valori hardcoded sembrano scorciatoie. Uno sviluppatore ha bisogno dell'URL di un database, lo digita direttamente in una stringa di connessione e prosegue. Tre mesi dopo, l'URL cambia, la modifica viene apportata in un file ma non in altri quattro, e la produzione si blocca alle 2 del mattino. Uno sviluppatore ha bisogno di una chiave API, la digita nel file sorgente, effettua il commit e il push. Sei mesi dopo, il repository viene clonato, la chiave compare in un fork pubblico e l'account viene compromesso prima che qualcuno se ne accorga. Questi non sono casi limite. Sono la traiettoria standard dei valori hardcoded nei sistemi software: scorciatoie apparentemente innocue che si accumulano in debiti di manutenzione, incidenti di sicurezza e fallimenti di implementazione.

Trova ed elimina i valori hardcoded

Eliminare e sbarazzarsi dei valori hardcoding

Saperne di più

La soluzione non è complicata. Variabili d'ambiente, file di configurazione, dependency injection e costanti centralizzate sono tutti modelli ben noti e disponibili in ogni linguaggio e framework principale. La sfida consiste nell'applicarli sistematicamente alle codebase esistenti, nell'imporli per il nuovo codice e nello sviluppare la disciplina necessaria per individuarli prima che raggiungano la produzione. Di seguito vengono illustrate tutte le tecniche necessarie a questo scopo, con esempi di codice funzionanti per Python, Java e JavaScript.

Sommario

Che cos'è un valore hardcoded?

Un valore hardcoded è una costante letterale incorporata direttamente nel codice sorgente, anziché essere fornita tramite configurazione, variabili d'ambiente, un database o input in fase di esecuzione. La caratteristica distintiva è l'assenza di indirezione: se la modifica del valore richiede la modifica del codice sorgente, la ricompilazione o la ridistribuzione di un'applicazione, si tratta di un valore hardcoded.

Esempi comuni:

Una stringa di connessione al database digitata direttamente in una classe di configurazione
Una chiave API o un token di accesso in un file sorgente
Un URL di servizio che punta a un ambiente specifico
Una soglia numerica (if (amount > 5000)) senza alcuna spiegazione o fonte esterna
Percorso di un file presuppone una specifica configurazione del server.
Una stringa di ruolo utente ("admin") sparsi nei controlli di autorizzazione

I valori hardcoded sono presenti in ogni linguaggio e in ogni codebase. Le applicazioni mainframe legacy codificano direttamente nei programmi COBOL i nomi dei dataset specifici dell'ambiente, i codici regionali e le soglie aziendali. I moderni microservizi accumulano valori di timeout, conteggi di tentativi e URL di individuazione dei servizi hardcoded nelle classi dell'applicazione. La forma cambia con il linguaggio, ma il problema rimane lo stesso.

Valori fissi vs. costanti: qual è la differenza?

I valori hardcoded vengono spesso confusi con le costanti, ma la distinzione è importante. Una costante rappresenta un fatto stabile, intenzionale, a livello di dominio, che è corretto per definizione e difficilmente cambierà: Math.PI, HTTP_STATUS_OK = 200, MAX_RETRY_ATTEMPTS = 3 (se tre è effettivamente corretto per tutti i contesti). Le costanti sono appropriate nel codice. Aggiungono chiarezza, prevengono errori di battitura e rendono esplicito l'intento.

Un valore hardcoded codifica un'ipotesi sul contesto di implementazione, sull'infrastruttura o sulle regole aziendali che si prevede possa variare. Un URL di un database di produzione, una chiave API, un'aliquota fiscale specifica per regione, lo stato di un flag di funzionalità: questi sono valori hardcoded mascherati da costanti. Il test è semplice: se il valore deve essere diverso in un ambiente, cliente o release diversi, non è una costante e non dovrebbe essere presente nel codice sorgente.

Che cos'è il soft coding?

La codifica flessibile (soft coding) è la pratica di rendere i valori configurabili in fase di esecuzione anziché fissi in fase di compilazione. Un valore codificato in modo flessibile può essere modificato tramite un file di configurazione, una variabile d'ambiente, una voce di database o un'interfaccia amministrativa, senza modificare il codice sorgente o ridistribuire l'applicazione. La codifica flessibile è l'approccio corretto per le impostazioni specifiche dell'ambiente, i parametri aziendali, i flag di funzionalità e qualsiasi valore che potrebbe dover differire tra gli ambienti di sviluppo, staging e produzione.

La differenza tra codifica rigida e codifica flessibile è la differenza tra un sistema che richiede una modifica del codice e un'implementazione per aggiornare un'aliquota fiscale e un sistema che consente a un membro del team operativo di aggiornarla in un file di configurazione e riavviare un servizio. Su larga scala, questa differenza si traduce in migliaia di ore di lavoro degli ingegneri e in un rischio operativo significativo.

Perché l'inserimento di codice rigido è una cattiva pratica

Distrugge la manutenibilità

I valori hardcoded si moltiplicano. Un URL di servizio hardcoded in un file diventa hardcoded in cinque file quando il modulo viene copiato per una nuova integrazione. Un numero magico che compare in un calcolo compare in tre quando la stessa logica viene replicata in contesti leggermente diversi. Ogni istanza rappresenta un obbligo di manutenzione separato: trovarla, aggiornarla, testare l'aggiornamento e sperare di non averne tralasciata nessuna.

Il problema della manutenibilità non riguarda solo lo sforzo, ma anche il rischio. Una ricerca e sostituzione in tutto il codice sorgente per aggiornare un valore hardcoded è un'operazione di refactoring con impatto sulla produzione. Ogni occorrenza mancante è un bug. Ogni sostituzione errata è un bug. L'unico modo per essere certi che la modifica sia completa è disporre di test automatizzati che fallirebbero se rimanesse anche una sola occorrenza, ma i test automatizzati sono proprio ciò che rende difficile la scrittura di valori hardcoded.

Blocca i test e la CI/CD

I test automatizzati devono essere eseguiti in ambienti controllati. Un test che si connette a un database di produzione perché la stringa di connessione è codificata in modo statico non è un test; è un'operazione di produzione che si verifica durante una build. Una pipeline CI che si interrompe perché un URL di servizio codificato in modo statico non è accessibile dal server di build non è un problema di infrastruttura di test; è un problema di codifica statica.

Le variabili d'ambiente e l'iniezione di configurazione sono ciò che permette di eseguire la stessa suite di test in ambienti di sviluppo locale, CI, staging e produzione con servizi di supporto differenti. Senza di esse, i test diventano specifici per l'ambiente, instabili e, alla fine, abbandonati.

Crea gravi vulnerabilità di sicurezza

Le credenziali hardcoded rappresentano una delle categorie di vulnerabilità più comuni e sfruttate nella sicurezza del software. Una chiave API, una password di database o un token di accesso hardcoded, inseriti nel sistema di controllo versione, persistono nella cronologia del repository anche dopo essere stati eliminati dal ramo corrente. Gli scanner automatici cercano continuamente questi schemi nei repository pubblici. Una chiave trovata in un commit di diciotto mesi fa è ancora valida se non è mai stata ruotata.

OWASP identifica esplicitamente le password hardcoded come una falla di sicurezza critica (CWE-259, CWE-798). Le linee guida del NIST richiedono che le credenziali non vengano mai memorizzate nel codice sorgente. Nonostante ciò, le fughe di credenziali tramite valori hardcoded rimangono tra le cause più frequenti di incidenti di sicurezza nel cloud.

Il rischio va oltre le credenziali. Gli URL dei servizi interni codificati rivelano la topologia dell'infrastruttura. Le stringhe dei ruoli utente codificate rivelano la logica di autorizzazione. Le soglie di validazione codificate possono essere aggirate una volta che un aggressore ne conosce i valori esatti. Nessuno di questi rischi per la sicurezza è immediatamente evidente, ed è per questo che si accumulano senza essere affrontati.

Credenziali e chiavi API codificate direttamente nel codice: la categoria a più alto rischio

I segreti codificati direttamente nel codice meritano un trattamento a parte, perché le conseguenze di un errore nella loro gestione sono fondamentalmente diverse da quelle di altri problemi di codifica rigida. Un valore di timeout codificato direttamente nel codice causa un bug. Una chiave API codificata direttamente nel codice causa una violazione dei dati.

Come appaiono le credenziali codificate direttamente nel codice

python

# Python -- hardcoded database credentials (never do this)
connection = psycopg2.connect(
    host="prod-db.internal.example.com",
    database="accounts",
    user="app_service",
    password="s3cr3tP@ssword!"   # hardcoded secret in source code
)

# Python -- correct approach: load from environment
import os
connection = psycopg2.connect(
    host=os.environ["DB_HOST"],
    database=os.environ["DB_NAME"],
    user=os.environ["DB_USER"],
    password=os.environ["DB_PASSWORD"]
)

Giava

// Java -- hardcoded API key (never do this)
private static final String API_KEY = "sk-prod-a1b2c3d4e5f6g7h8i9j0";

// Java -- correct approach: load from environment
private static final String API_KEY = System.getenv("OPENAI_API_KEY");

Come correggere le credenziali hardcoded

Variabili ambientali sono la soluzione standard per la gestione dei segreti nelle applicazioni distribuite. Il segreto viene impostato nell'ambiente di distribuzione (server, container, segreto di Kubernetes o gestore di segreti cloud) e vi si accede in fase di esecuzione. Il codice sorgente non contiene il valore del segreto, ma solo il nome della chiave utilizzata per recuperarlo.

Servizi di gestione dei segretiAWS Secrets Manager, HashiCorp Vault, Azure Key Vault e Google Secret Manager rappresentano l'approccio di livello produttivo per la rotazione, il controllo e la distribuzione dei segreti tra i servizi. L'applicazione recupera il segreto all'avvio (o su richiesta) dal vault anziché da una variabile d'ambiente, garantendo la rotazione senza necessità di ridistribuzione e un registro di controllo completo di ogni accesso.

.env file (utilizzando librerie come python-dotenv or dotenv in Node.js) sono adatti allo sviluppo locale. Forniscono la stessa interfaccia delle variabili d'ambiente ma caricano da un file locale. La regola fondamentale: .env i file devono essere in .gitignore e non deve mai essere commesso.

Individuare segreti già commessi: se un segreto è stato hardcoded e confermato, dovrebbe essere considerato compromesso e ruotato immediatamente. L'eliminazione del valore dal ramo corrente non lo rimuove dalla cronologia di git. Strumenti come git-filter-branch oppure BFG Repo Cleaner può cancellare la cronologia, ma l'ipotesi più sicura dopo un commit è che il segreto sia esposto.

Come evitare chiavi API hardcoded

Per le chiavi API di terze parti, le alternative all'inserimento manuale dipendono dal contesto:

Applicazioni lato server: variabili d'ambiente o servizi di gestione dei segreti
Pipeline CI / CD: variabili segrete della pipeline (segreti di GitHub Actions, variabili di GitLab CI)
Applicazioni in movimentoLe chiavi API non dovrebbero mai trovarsi nel codice lato client; utilizzare un proxy backend che chiami l'API con la chiave memorizzata lato server.
Agenti di intelligenza artificiale e integrazioni LLM: caricare le chiavi API dall'ambiente all'avvio dell'agente, non passarle mai come stringhe hardcoded nei prompt o nelle chiamate di funzione

La programmazione sicura RPG su IBM i segue lo stesso principio: le aree dati esterne, le code di dati o i valori di sistema dovrebbero contenere parametri di connessione specifici dell'ambiente anziché codificarli nel codice sorgente del programma.

Come prevenire i valori hardcoded: modelli completi con codice

variabili ambientali

Le variabili d'ambiente rappresentano la soluzione più universale. Sono supportate da tutti i principali sistemi operativi, piattaforme cloud, sistemi di containerizzazione e framework di distribuzione.

python

# Python: load all configuration from environment
import os
from dotenv import load_dotenv

load_dotenv()  # loads .env file in development; ignored in production

DATABASE_URL = os.environ["DATABASE_URL"]
API_BASE_URL = os.environ.get("API_BASE_URL", "https://api.example.com")
MAX_RETRIES  = int(os.environ.get("MAX_RETRIES", "3"))
DEBUG_MODE   = os.environ.get("DEBUG", "false").lower() == "true"

javascript

// Node.js: access environment variables
require('dotenv').config();  // load .env in development

const config = {
  dbUrl:      process.env.DATABASE_URL,
  apiKey:     process.env.API_KEY,
  port:       parseInt(process.env.PORT, 10) || 3000,
  debug:      process.env.NODE_ENV !== 'production',
};

Giava

// Java: environment variables via System.getenv()
public class AppConfig {
    public static final String DB_URL  = System.getenv("DATABASE_URL");
    public static final String API_KEY = System.getenv("THIRD_PARTY_API_KEY");
    public static final int    TIMEOUT = Integer.parseInt(
        Optional.ofNullable(System.getenv("REQUEST_TIMEOUT_MS")).orElse("5000")
    );
}

File di configurazione

I file di configurazione esternalizzano valori specifici dell'ambiente ma non segreti, come i nomi dei servizi, i flag delle funzionalità, le dimensioni della paginazione e i TTL della cache.

YAML

# config/production.yaml
database:
  host: prod-db.internal
  port: 5432
  pool_size: 20

api:
  base_url: https://api.partner.com/v2
  timeout_ms: 3000
  max_retries: 3

features:
  new_checkout: true
  beta_dashboard: false

python

# Load at startup; never hardcode the values it contains
import yaml

with open(f"config/{os.environ['APP_ENV']}.yaml") as f:
    config = yaml.safe_load(f)

timeout = config["api"]["timeout_ms"]

Iniezione di dipendenza

L'iniezione delle dipendenze passa i valori configurati ai componenti, anziché consentire ai componenti di creare o recuperare la propria configurazione. Ciò rende i componenti testabili in isolamento e configurabili per ogni ambiente.

Giava

// Spring Boot: inject configuration via @Value
@Service
public class PaymentService {
    @Value("${payment.api.url}")
    private String apiUrl;

    @Value("${payment.api.timeout-ms}")
    private int timeoutMs;

    // No hardcoded URL or timeout anywhere in this class
    public PaymentResult process(Payment payment) {
        // uses apiUrl and timeoutMs injected from application.properties
    }
}

python

# Python: simple constructor injection
class EmailService:
    def __init__(self, smtp_host: str, smtp_port: int, api_key: str):
        self.smtp_host = smtp_host
        self.smtp_port = smtp_port
        self.api_key   = api_key

# Wire at application startup, reading from environment
email_service = EmailService(
    smtp_host=os.environ["SMTP_HOST"],
    smtp_port=int(os.environ["SMTP_PORT"]),
    api_key=os.environ["EMAIL_API_KEY"],
)

Costanti e enumerazioni centralizzate

I valori che sono effettivamente fissi per impostazione predefinita, come i codici di stato HTTP, gli stati specifici del dominio e gli identificatori di protocollo, dovrebbero essere contenuti in un unico modulo di costanti denominato, anziché essere sparsi come stringhe letterali.

python

# Python: centralised constants
from enum import Enum

class OrderStatus(Enum):
    PENDING   = "pending"
    CONFIRMED = "confirmed"
    SHIPPED   = "shipped"
    DELIVERED = "delivered"
    CANCELLED = "cancelled"

# Usage: no magic strings scattered across modules
if order.status == OrderStatus.CONFIRMED:
    notify_warehouse(order)

Giava

// Java: enum with business meaning
public enum UserRole {
    ADMIN("admin"),
    EDITOR("editor"),
    VIEWER("viewer");

    private final String value;
    UserRole(String value) { this.value = value; }
    public String getValue() { return value; }
}

// Replaces scattered "admin", "editor", "viewer" strings
if (user.getRole() == UserRole.ADMIN) {
    grantFullAccess(user);
}

Codifica rigida in linguaggi specifici

Che cos'è l'hardcoding in Python?

In Python, l'hardcoding appare più comunemente come stringhe letterali per URL e credenziali, costanti numeriche nella logica di business e percorsi di file che presuppongono una specifica struttura di directory. os.environ e python-dotenv sono i meccanismi standard per la configurazione basata sull'ambiente. configparser Il modulo gestisce i file di configurazione in formato INI. pydantic-settings Fornisce una configurazione con convalida del tipo a partire da variabili d'ambiente con valori predefiniti, che è l'approccio consigliato per i servizi Python in produzione.

Rilevamento di valori hardcoded in Python: strumenti di analisi statica come Bandit (per hardcoded relativi alla sicurezza come password e chiavi), Pylint e Semgrep possono identificare automaticamente credenziali hardcoded e magic number.

Che cos'è l'hardcoding in Java?

In Java, i valori hardcoded appaiono spesso come private static final String campi, @Value annotazioni con valori predefiniti inline che dovrebbero essere esternalizzati e letterali nella logica di business. Spring Boot application.properties e application.yml I file rappresentano il meccanismo di esternalizzazione standard. @ConfigurationPropertiesLe classi annotate forniscono oggetti di configurazione validi e con tipizzazione sicura a partire da file YAML o di proprietà.

Rilevamento di valori hardcoded in Java: SpotBugs con il plugin Find Security Bugs rileva le credenziali hardcoded. SonarQube segnala i magic number, gli URL hardcoded e le password hardcoded. SMART TS XLL'analisi aziendale di copre le codebase Java insieme a COBOL e altri linguaggi legacy.

Codifica rigida nel codice legacy e mainframe

I programmi COBOL, RPG e PL/I sui mainframe e sui sistemi midrange IBM presentano specifici schemi di codifica rigida: nomi di dataset incorporati nelle istruzioni DD, identificatori di ambiente nella logica del programma e soglie aziendali compilate direttamente nei programmi. L'esternalizzazione di questi valori richiede strumenti compatibili con i mainframe: parametri di sistema (SYSPARM), aree dati esterne, tabelle di configurazione in DB2 e JCL parametrizzato. Per rilevare questi schemi su larga scala sono necessari strumenti di analisi statica in grado di interpretare i linguaggi mainframe.

Refactoring nel mondo reale: dal codice rigido alla configurazione

L'approccio di refactoring in tre fasi

Fase 1: Scoperta. Eseguire un'analisi statica dell'intero codice sorgente per creare un inventario dei valori hardcoded, raggruppati per tipo (credenziali, URL, logica di business, numeri magici) e per livello di rischio. Assegnare priorità alle credenziali e ai valori specifici dell'ambiente di produzione.

Fase 2: Esternalizzazione per categoria. Iniziate dalle credenziali (il rischio più elevato): spostate tutti i segreti in variabili d'ambiente o in un gestore di segreti. Quindi, occupatevi degli URL e dei nomi dei servizi specifici dell'ambiente. Poi, affrontate le soglie della logica di business. Infine, gestite i numeri magici sostituendoli con costanti denominate o valori di configurazione.

Fase 3: Applicazione. Aggiungi controlli di analisi statica alla pipeline CI che falliscano in presenza di nuove credenziali hardcoded. Aggiungi regole di linting che segnalino i numeri magici. Aggiungi elementi alla checklist di revisione del codice. L'obiettivo è rendere più difficile l'inserimento di un valore hardcoded rispetto all'utilizzo del modello corretto.

Identificazione dei valori hardcoded nei progetti legacy

Nei progetti legacy in cui si sono accumulati nel corso degli anni valori hardcoded:

Usa il grep o ricerca nel repository di modelli comuni: stringhe di connessione, password, apikeymodelli di indirizzi IP e nomi di servizi ben noti
Eseguire strumenti di analisi statica (Bandit, SonarQube, Semgrep, SMART TS XL) per ottenere un inventario completo senza revisione manuale file per file
Controlla la cronologia di Git per i segreti che sono stati precedentemente confermati ed eliminati; sono ancora accessibili nella cronologia del repository.
Cerca i valori che compaiono in modo identico in più file: questi sono candidati per la centralizzazione.

Prevenire l'introduzione di valori hardcoded

Hook di pre-commit: eseguire la scansione delle credenziali (ad esempio, detect-secrets, git-secrets, truffleHog) ad ogni commit prima che raggiunga il repository
Gate della pipeline CI: non riesce a completare le build che contengono risultati di analisi statica introdotti di recente per le credenziali o i numeri magici
Liste di controllo per la revisione del codice: elementi espliciti per l'esternalizzazione della configurazione nel processo di revisione del team
Onboarding degli sviluppatori: rendere i modelli corretti i predefiniti, fornire un modello di progetto che utilizza già variabili d'ambiente e un .env.example filetto

Come SMART TS XL Elimina i valori hardcoded su larga scala

La ricerca manuale e l'utilizzo di grep sono sufficienti per individuare casi evidenti in codebase di piccole dimensioni. Nei sistemi aziendali, che si estendono su milioni di righe di codice in COBOL, Java, Python, .NET, RPG e SQL, l'individuazione completa di valori hardcoded richiede un'analisi strutturale automatizzata. SMART TS XL esegue un'analisi statica su tutte queste lingue simultaneamente, creando un modello di riferimento incrociato unificato che identifica:

Valori stringa letterali nei parametri di connessione e nelle chiamate di autenticazione, segnalati come potenziale esposizione delle credenziali.
Numeri magici nella logica aziendale confrontati con una baseline configurabile, identificando valori incoerenti tra i moduli o che appaiono con valori diversi in punti diversi.
Valori letterali duplicati che compaiono in più file ma che svolgono la stessa funzione logica, indicando opportunità di centralizzazione.
Valori nei programmi COBOL che codificano identificatori specifici dell'ambiente, generalmente gestiti tramite parametri JCL.
Percorsi di flusso dei dati dai valori hardcoded attraverso il sistema, che mostrano quali operazioni a valle dipendono da essi prima che venga presa una decisione di refactoring.

Migliori analisi statica del codice la capacità fornisce l'inventario. analisi d'impatto La capacità mostra cosa verrà influenzato quando viene sostituito un valore hardcoded. modernizzazione dell'eredità Questa funzionalità estende il concetto a scenari multi-linguaggio e multi-piattaforma in cui lo stesso valore logico è codificato in modo indipendente in un programma mainframe e in un servizio Java, richiedendo una correzione coordinata anziché interventi isolati.

Per i team che gestiscono specificamente il debito di garanzia, SMART TS XLIl rilevamento delle credenziali hardcoded si integra nelle pipeline CI/CD come un punto di controllo della build: i nuovi commit che introducono segreti hardcoded causano automaticamente l'interruzione della build, prima che il codice raggiunga un repository dove potrebbe essere esposto.

L'hardcoding è un problema di disciplina, non di conoscenza.

La maggior parte degli sviluppatori che inseriscono valori direttamente nel codice sa di non doverlo fare. L'esistenza delle variabili d'ambiente, il corretto approccio nell'utilizzo dei file di configurazione e il fatto che le credenziali non debbano mai essere presenti nel codice sorgente sono concetti ampiamente diffusi e compresi. Il problema non è la mancanza di conoscenza, ma la disciplina sotto pressione.

Le scadenze di consegna fanno sì che la configurazione delle variabili d'ambiente sembri un onere eccessivo. I codebase legacy rendono l'esternalizzazione più rischiosa rispetto al mantenimento dei valori originali. I team numerosi con un onboarding incoerente facilitano la copia, da parte di un nuovo sviluppatore, di un modello esistente che si rivela errato. Affrontare il problema dell'hardcoding a livello organizzativo richiede quindi più della semplice documentazione: richiede un'applicazione automatizzata che renda il modello errato più difficile da adottare rispetto a quello corretto.

Hook pre-commit che rifiutano i commit contenenti segreti, pipeline CI che falliscono in presenza di nuovi valori magici, checklist di revisione del codice che chiedono esplicitamente informazioni sull'esternalizzazione della configurazione e strumenti di analisi statica che mettono in luce l'intera portata dei valori hardcoded esistenti in una codebase: questi sono i meccanismi che colmano il divario tra la conoscenza dell'approccio corretto e la sua applicazione coerente. Gli esempi di codice e i modelli presentati in questo articolo forniscono le basi tecniche. Sono i meccanismi di applicazione che ne garantiscono la consolidazione.