新着記事

システム開発

【運用設計】システム基盤から見る「運用設計書」~目次サンプルを解説~

はじめに システム開発のプロジェクトに参画していると、運用設計漏れや誤りを原因とするトラブルに遭遇することが多くあります。運用設計漏れや誤りはシステムの重大エラー見逃しにもつながり、システムを提供するお客様の社会的価値の損失になりかねReadMore...
AWS

クラウドが「障害を吸収した」のに、なぜOSが死んだのか|IaaS/SaaS境界の落とし穴

クラウドがストレージ障害を吸収しても、ASMログ肥大化によりゲストOSの/var領域が枯渇し、ジョブ停止に至ることがあります。OCI Exadataの事例をもとに、責任分担モデル、ログ管理、OS領域監視、RDS for Oracleとの違いを整理します。
AWS

【第1部】クラウドリフトの失敗は構築前に始まっている|PoC不足が手戻り・コスト超過・納期遅延を招く理由

クラウドリフトの失敗は構築中に突然始まるのではなく、PoCや設計段階で潰すべきリスクを残したまま進んだ結果として表面化する。大規模SIの現場経験をもとに、失敗の構造を整理します。
AWS

【第2部・前編】クラウドリフトPoCで「動いた」は確認できた。しかし業務では使えなかった|10の設計リスク① 可用性・性能・ストレージ・バックアップ・監視

PoCで「動いた」は確認できた。しかし構築フェーズで業務が回らなかった。可用性・性能・ストレージ・バックアップ・監視の5領域で、見落とすと手戻りになる設計リスクを整理します。
トラブル

EBSは増やせても、簡単には減らせない|RHEL環境で見落とした「容量縮小=ディスク移行」という現実

EBSの縮小はAWSコンソールでできない。容量縮小の実態は小容量ディスクへのデータ移行です。RHEL環境での3つの案と、XFS・UUID・マウント設定の確認観点を整理します。
AWS

CloudWatch Logsのログエクスポートが失敗した話|「ジョブは動く」と「運用で回る」は別物

IAMもS3バケットも正常なのに日次ジョブが失敗する。CloudWatch LogsのExportTask同時実行制約と、複数システム共存時の運用設計・テスト観点を整理します。
タイトルとURLをコピーしました