최신 Professional-Data-Engineer日本語 무료덤프 - Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)
組織では、6 か月間 Google BigQuery でデータを収集し、分析してきました。分析されたデータの大部分は、events_partitioned という時間パーティション テーブルに格納されています。クエリのコストを削減するために、組織では events というビューを作成しました。このビューは、過去 14 日間のデータのみをクエリします。このビューは、レガシー SQL で記述されています。来月、既存のアプリケーションは BigQuery に接続し、ODBC 接続を介してイベント データを読み取ることになります。アプリケーションが接続できることを確認する必要があります。実行する必要があるアクションはどれですか (2 つ選択してください)。
정답: A,E
人間の顔が含まれているかどうかがラベル付けされた画像のデータセットがあるとします。このラベル付けされたデータセットを使用して画像内の人間の顔を認識するニューラル ネットワークを作成するには、どのようなアプローチが最も効果的でしょうか。
정답: B
설명: (DumpTOP 회원만 볼 수 있음)
Cloud Storage には、データ サイエンス チームがモデルで使用したいさまざまなファイルがあります。現在、ユーザーには Cloud Storage 内のデータを探索、クレンジング、検証する方法がありません。データ サイエンス チームが Cloud Storage 内のデータをすばやくクレンジングおよび探索するために使用できるローコード ソリューションを探しています。どうすればよいでしょうか。
정답: C
설명: (DumpTOP 회원만 볼 수 있음)
組織のマーケティング チームは、顧客データセットのセグメントを定期的に更新しています。マーケティング チームから、BigQuery で更新する必要がある 100 万件のレコードを含む CSV が提供されています。BigQuery で UPDATE ステートメントを使用すると、quotaExceeded エラーが発生します。どうすればよいでしょうか。
정답: A
BigQuery のデータ変換ソリューションを設計しています。開発者は SOL に精通しており、ELT 開発手法を使用したいと考えています。さらに、開発者は直感的なコーディング環境と、SQL をコードとして管理する能力を必要としています。開発者がこれらのパイプラインを構築するためのソリューションを特定する必要があります。何をすべきでしょうか?
정답: D
설명: (DumpTOP 회원만 볼 수 있음)
BigQuery に保存されている顧客データを暗号化したいと考えています。テーブルに保存されているデータに対して、ユーザー向けの暗号化削除を実装する必要があります。カスタム ソリューションを回避するために、Google Cloud のネイティブ機能を採用したいと考えています。どうすればよいでしょうか。
정답: B
설명: (DumpTOP 회원만 볼 수 있음)
顧客の住所を含むBigQueryデータセットが1つあります。データセットからすべての住所を取得したいとします。どうすればよいでしょうか?
정답: B
설명: (DumpTOP 회원만 볼 수 있음)
Google の Dataflow SDK を使用して、以下に示すような顧客データを分析する予定です。プロジェクトの要件は、データ ソースから顧客名のみを抽出し、出力 PCollection に書き込むことです。
トム、555 X 通り
ティム、553 Yストリート
サム、111 Z ストリート
上記のデータ処理要件に最適な操作はどれですか?
トム、555 X 通り
ティム、553 Yストリート
サム、111 Z ストリート
上記のデータ処理要件に最適な操作はどれですか?
정답: B
설명: (DumpTOP 회원만 볼 수 있음)
BigQuery ジョブを実行するプロジェクトが 2 つあります。
* あるプロジェクトでは、完了時間の SLA が厳格に定められた運用ジョブを実行しています。これらは優先度の高いジョブであり、必要なときに必要なコンピューティング リソースを利用できる必要があります。これらのジョブの使用率は、通常 300 スロットを下回ることはありませんが、時折、さらに 500 スロットまで急上昇することがあります。
* もう 1 つのプロジェクトは、ユーザーがアドホック分析クエリを実行するためのものです。このプロジェクトでは通常、一度に 200 を超えるスロットが使用されることはありません。これらのアドホック クエリは、スロット容量ではなく、ユーザーがスキャンするデータの量に基づいて課金されるようにします。
両方のプロジェクトで適切なコンピューティング リソースが利用可能であることを確認する必要があります。どうすればよいでしょうか?
* あるプロジェクトでは、完了時間の SLA が厳格に定められた運用ジョブを実行しています。これらは優先度の高いジョブであり、必要なときに必要なコンピューティング リソースを利用できる必要があります。これらのジョブの使用率は、通常 300 スロットを下回ることはありませんが、時折、さらに 500 スロットまで急上昇することがあります。
* もう 1 つのプロジェクトは、ユーザーがアドホック分析クエリを実行するためのものです。このプロジェクトでは通常、一度に 200 を超えるスロットが使用されることはありません。これらのアドホック クエリは、スロット容量ではなく、ユーザーがスキャンするデータの量に基づいて課金されるようにします。
両方のプロジェクトで適切なコンピューティング リソースが利用可能であることを確認する必要があります。どうすればよいでしょうか?
정답: C
설명: (DumpTOP 회원만 볼 수 있음)
Dataproc クラスタ インスタンス上のソフトウェアをカスタマイズする方法ではないものはどれですか。
정답: B
설명: (DumpTOP 회원만 볼 수 있음)
あなたのチームは、社内の ETL の開発と保守を担当しています。入力データにエラーがあるために、データフロー ジョブの 1 つが失敗しており、パイプラインの信頼性を向上させる必要があります (失敗したデータをすべて再処理できるようにするなど)。
何をすべきでしょうか?
何をすべきでしょうか?
정답: D
レガシー SQL と標準 SQL に関する次の記述のうち、正しくないものはどれですか。
정답: C
설명: (DumpTOP 회원만 볼 수 있음)
Google が課金する BigQuery 操作とは何ですか?
정답: B
설명: (DumpTOP 회원만 볼 수 있음)
Google Cloud で新しいパイプラインを作成し、Cloud Pub/Sub から Cloud Dataflow を経由して BigQuery に IoT データをストリーミングしています。データをプレビューすると、約 2% のデータが破損しているようです。この破損したデータを除外するには、Cloud Dataflow パイプラインを変更する必要があります。どうすればよいでしょうか。
정답: C
あなたは、さまざまなストレージ サービスでそれぞれのデータ所有者によってデータが整理および管理されている医療組織の一員です。この分散型エコシステムの結果、データの検出と管理が困難になっています。組織を支援するために、コストを最適化したソリューションを迅速に特定して実装する必要があります。
* データ管理と発見
* データ系統の追跡
* データ品質の検証
ソリューションをどのように構築すればよいでしょうか?
* データ管理と発見
* データ系統の追跡
* データ品質の検証
ソリューションをどのように構築すればよいでしょうか?
정답: C
설명: (DumpTOP 회원만 볼 수 있음)
日付ごとに分割された、何百万行もの売上データを含むテーブルがあります。さまざまなアプリケーションとユーザーが、1 分間に何度もこのデータをクエリします。クエリでは、平均、最大、合計を使用して値を集計する必要があり、他のテーブルに結合する必要はありません。必要な集計は過去 1 年間のデータに対してのみ計算されますが、ベース テーブルには完全な履歴データを保持する必要があります。クエリ結果に常にテーブルの最新データが含まれるようにすると同時に、計算コスト、メンテナンスのオーバーヘッド、および期間を削減する必要があります。どうすればよいでしょうか。
정답: A
설명: (DumpTOP 회원만 볼 수 있음)
あなたは銀行で働いています。すでに承認されたローン申請に関する情報と、これらの申請が不履行になったかどうかを含むラベル付きデータセットがあります。あなたは、融資申請者の不履行率を予測するモデルをトレーニングするように依頼されました。
何をすべきでしょうか?
何をすべきでしょうか?
정답: C
Google Cloud にデータ パイプラインをデプロイする一環として、20 TB のテキスト ファイル用のストレージを設計しています。入力データは CSV 形式です。複数のエンジンを使用して Cloud Storage のデータをクエリする複数のユーザーに対して集計値をクエリするコストを最小限に抑えたいと考えています。どのストレージ サービスとスキーマ設計を使用すればよいでしょうか。
정답: B
組織全体のデータセットを準備しています。Cloud Storage の制限付きバケットに保存されている顧客データを前処理する必要があります。このデータは消費者分析を作成するために使用されます。特定の機密データ要素を保護するなど、データ プライバシー要件に従う必要がありますが、同時に将来の潜在的なユースケースのためにすべてのデータを保持する必要があります。どうすればよいでしょうか。
정답: B
설명: (DumpTOP 회원만 볼 수 있음)
Google Cloud Platform 上で実行される POS アプリケーションで支払い取引を処理したいと考えています。ユーザー ベースは飛躍的に増加する可能性がありますが、インフラストラクチャのスケーリングを管理する必要はありません。
どの Google データベース サービスを使用すればよいですか?
どの Google データベース サービスを使用すればよいですか?
정답: C