Amazon Bedrock: “Sorry, I’m unable to assist you with this request”. Indagine e risoluzione del m...
15 Gennaio 2025 - 11 min. read
Matteo Goretti
DevOps Engineer
Bentornati alla nostra serie di articoli sul Platform-as-a-Service su Amazon Web Service.
Abbiamo iniziato introducendo i fondamentali per un corretto approccio al PaaS su AWS preseguendo poi analizzando i servizi condivisi alla base del funzionamento della nostra vending machine.
È il momento di focalizzarci sui servizi dedicati agli utenti finali.
Per comodità abbiamo diviso i servizi in due repository e, come accennato nel primo articolo, al loro interno troviamo gli stack:
La pipeline infrastrutturale eseguirà i seguenti step:
Il file paker-customer-environment.pkr.hcl viene generato dal deploy di CDK utilizzando dei dati recuperati dal commit. Viene validato ed eseguito
source ./configFile.sh
AMI_DESCRIPTION=\"commit id: $COMMIT_ID\\n time stamp: $COMMIT_TIME\\n commit by: $COMMIT_AUTHOR_NAME\\n message: $COMMIT_MESSAGE\"
sed -i s/PLACE_CODEBUILD_BUILD_ID/$CODEBUILD_BUILD_NUMBER/g packer-CUSTOMER-$ENVIRONMENT.pkr.hcl
packer validate packer-$CUSTOMER-$ENVIRONMENT.pkr.hcl
packer build packer-$CUSTOMER-$ENVIRONMENT.pkr.hcl
export AMI_ID=$(cat manifest-$CUSTOMER-$ENVIRONMENT.json | grep artifact_id | cut -d ":" -f3 | cut -d '\"' -f1)
export AMI_NAME=ami-$CUSTOMER-$ENVIRONMENT-$CODEBUILD_BUILD_NUMBER
export INSTANCE_NAME=$CUSTOMER-$ENVIRONMENT-$CODEBUILD_BUILD_NUMBER
Per il solo ambiente di produzione si è scelto di aggiungere uno stage che impedisce di rilasciare modifiche non volute per errore:
myPipeline.addStage({
stageName: 'approve',
placement: {
justAfter: myPipeline.stages[1],
}
}).addAction( new aws_codepipeline_actions.ManualApprovalAction({
actionName: `${process.env.CUSTOMER}-approve`,
notificationTopic: new Topic(this, `${process.env.CUSTOMER}-${process.env.ENVIRONMENT}-software-sh-pipeline`),
notifyEmails: configFile.approvalEmails,
additionalInformation: `${process.env.CUSTOMER} deploy to ${process.env.ENVIRONMENT}`
})
)
}
Nel momento in cui la pipeline arriva a questo step, viene inviata una mail agli indirizzi precedenetemente indicati (nell’esempio sopra sono indicati nella configurazione approvalEmails). La persona che si occuperà di verificare l’aggiornamento richiesto potrà permettere l’esecuzione della pipeline, oppure bloccarla per correggere eventuali errori.
Lo stage configura le credenziali di git e clona il repository; effettua poi una chiamata al ALB condiviso per calcolare la priorità della regola da applicare al listener. Se si tratta di un aggiornamento ad una regola già esistente, la priorità non verrà modificata.
In caso di dominio custom e ambiente di produzione verrà deployato un Application Load Balancer nominale con due listener (porta 80 http e porta 443 https)
myCustomAppLoadBalancer.addListener(`App-80-Listener`, {
port: 80,
defaultAction: elbv2.ListenerAction.redirect({
permanent: true,
port: '443',
protocol: 'HTTPS',
})
})
const myCustom443ApplicationListener =
myCustomAppLoadBalancer.addListener(`App-443-Listener`, {
port: 443,
defaultAction: elbv2.ListenerAction.fixedResponse(503, {
contentType: `text/plain`,
messageBody: 'host not found',
})
})
E agganciato il certificato dell’utente
const wildcardListenerCertificate = elbv2.ListenerCertificate.fromArn(`${configFile.customer.certificate.arn}`)
myCustom443ApplicationListener.addCertificates(`Wildcard-${localUpperCustomer}-Cert`, [wildcardListenerCertificate])
Viene creato un database RDS, le parametrizzazioni sono definite all’interno di un file di configurazione. Tra questi parametri troviamo:
Grazie al servizio AWS Autoscaling possiamo configurare delle soglie che, una volta superate, scateneranno la creazione di una nuova istanza che potrà gestire parte del traffico.
Per poter configurare un Autoscaling group è necessario fornire un Launch Template (preferito da AWS) oppure un Launch Configuration (che sta cadendo in disuso). Per qualche motivo il costrutto AutoScaling fornito da AWS CDK utilizza di default il Launch Configuration, ma ci aspettiamo che nelle versioni future della classe venga implementato l’utilizzo del Launch Template!
Viene creato il target group utilizzando le configurazioni fornite dall’utente (dal file di config) per gestire gli health check con cui verificare l’integrità delle risorse di destinazione. Questo target group verrà associato poi all’Application Load Balancer.
La destinazione finale…
Questa è la pipeline che realmente effettua il deploy del software del cliente all’interno del gruppo di istanze EC2 dedicate, ed è suddivisa nei seguenti stage.
Effettua dei test sul codice e per farlo utilizza la funzionalità messa a disposizione da CodeBuild tramite l’utilizzo del file buildSpec.yaml e un’immagine personalizzata su cui fare i test scaricata direttamente dal servizio ECR.
Il buildSpec file è un file YAML che racchiude le configurazioni necessarie al progetto di CodeBuild:
version: 0.2
phases:
install:
commands:
- echo Entered the install phase...
finally:
- echo This always runs even if the update or install command fails
pre_build:
commands:
- echo Entered the pre_build phase...
finally:
- echo This always runs even if the login command fails
build:
commands:
- echo Entered the build phase...
finally:
- echo This always runs even if the install command fails
post_build:
commands:
- echo Entered the post_build phase...
- echo Build completed on `date`
artifacts:
files:
- location
- location
name: artifact-name
Permette di dare piena autonomia al cliente sui comandi che devono essere eseguiti dal job di build divisi per sezione.
Come per la pipeline infrastrutturale vogliamo proteggerci da aggiornamenti non voluti che potrebbero causare down-time nell’applicazione. Per questo motivo ogni rilascio in produzione deve essere confermato da un essere umano.
Utilizzando il servizio CodeDeploy possiamo automatizzare l’aggiornamento delle nostre virtual machine e il deploy del codice appena approvato.
new codedeploy.ServerDeploymentGroup(this, `Deployment-Group-${localUpperCustomer}-${localUpperEnvironment}`, {
deploymentGroupName: `${process.env.CUSTOMER}-${process.env.ENVIRONMENT}-deploy-group`,
loadBalancer: codedeploy.LoadBalancer.application(props.targetGroup),
autoScalingGroups: [props.asg],
role: softwarePipelineRole,
application: deployApp,
deploymentConfig: codedeploy.ServerDeploymentConfig.ONE_AT_A_TIME,
installAgent: true,
autoRollback: {
failedDeployment: true,
stoppedDeployment: true
}
})
Anche per questo servizio la funzionalità di gestione dei comandi da file viene in nostro aiuto, il file da mettere nella root del repository software si chiama appspec.yaml.
version: 0.0
os: linux
files:
- source: /
destination: /var/www/html
hooks:
BeforeInstall: # You can use this deployment lifecycle event for preinstall tasks, such as decrypting files and creating a backup of the current version
- location: deployScript/beforeInstall.sh
timeout: 300
runas: root
# INSTALL – During this deployment lifecycle event, the CodeDeploy agent copies the revision files from the temporary location to the final destination folder. This event is reserved for the CodeDeploy agent and cannot be used to run scripts.
AfterInstall: # You can use this deployment lifecycle event for tasks such as configuring your application or changing file permissions
- location: deployScript/afterInstall.sh
timeout: 300
runas: root
ApplicationStart: # You typically use this deployment lifecycle event to restart services that were stopped during ApplicationStop
- location: deployScript/applicationStart.sh
timeout: 300
runas: root
ValidateService: # This is the last deployment lifecycle event. It is used to verify the deployment was completed successfully.
- location: deployScript/validateService.sh
timeout: 300
runas: root
Quando vediamo l’iconica scritta Succeeded con il flag verde in corrispondenza della pipeline software avremo completato tutto il percorso e saremo in possesso del parco macchine con il nostro software installato pronto per essere usato.
Quando un cliente ci chiederà un parco macchine potremo tranquillamente creare il file di configurazione dedicato e lanciare il deploy degli stack di infrastruttura (il primo repository analizzato in questo articolo) e la “magia” dello IAC farà il resto permettendo anche di concentrare gli sforzi dell’utente finale solo sullo sviluppo e mantenimento del proprio software.
Proud2beCloud è il blog di beSharp, APN Premier Consulting Partner italiano esperto nella progettazione, implementazione e gestione di infrastrutture Cloud complesse e servizi AWS avanzati. Prima di essere scrittori, siamo Solutions Architect che, dal 2007, lavorano quotidianamente con i servizi AWS. Siamo innovatori alla costante ricerca della soluzione più all'avanguardia per noi e per i nostri clienti. Su Proud2beCloud condividiamo regolarmente i nostri migliori spunti con chi come noi, per lavoro o per passione, lavora con il Cloud di AWS. Partecipa alla discussione!